**章半结构化数据的应用背景(1)
**节研究背景(2)
第二节研究内容及意义(6)
一 研究内容(6)
二 研究意义(8)
第三节本书结构(9)
第二章半结构化数据的基础知识(12)
**节半结构化数据的结构特征(12)
第二节半结构化数据的结构模型(15)
第三节半结构化数据的模式语言(16)
第四节半结构化数据的查询语言(17)
第五节半结构化数据的应用程序接口(19)
第三章半结构化数据的管理模型(22)
**节半结构化数据模式提取的相关研究(23)
第二节半结构化数据节点编码的相关研究(26)
第三节半结构化数据索引的相关研究(27)
第四节半结构化数据查询处理的相关研究(30)
第四章半结构化数据的模式提取(33)
**节半结构化数据的元素内容模型(34)
一半结构化数据的树状结构模型(34)
二半结构化数据的元素内容模型(36)
三提取大规模半结构化数据模式的质量标准(38)
第二节基于正则表达式的模式提取方法(39)
一元素内容模型的正则表示(39)
二XStruct算法简介(42)
三XStruct算法的优缺点(46)
第三节基于集合/序列的模式提取方法——XTree(48)
一XTree算法的组成(48)
二基于集合/序列的元素内容模型(50)
三XTree的数据结构(51)
四提取元素内容模型(55)
五识别数据类型(57)
六提取属性(58)
七输出模式(59)
第四节实证研究(59)
一XTree的算法的时间和空间复杂度分析(60)
二元素内容模型的有序性判断对模式准确性的影响(61)
三实验环境及测试工具(63)
四测试数据集(64)
五提取不同文档的模式的时间和内存
消耗以及准确性(67)
六XTree算法提取同结构的不同大小的数据
模式的时间消耗(71)
第五节小结(72)
第五章半结构化数据的节点编码(75)
**节半结构化数据节点编码的特点(76)
一半结构化数据节点编码的质量评价标准(76)
二基于区间的节点编码方案(77)
三基于前缀的节点编码方案(82)
四ORDPATH编码方案(85)
第二节D2编码方案(89)
一D2编码方案的基本概念(89)
二静态D2编码(92)
三动态D2编码(94)
第三节D2编码的二进制表示(95)
一D2编码的二进制表示(96)
二D2物理编码的比较(102)
第四节实证研究(106)
一D2物理编码长度分析(106)
二D2物理编码长度实验(107)
第五节小结(109)
第六章半结构化数据的索引和查询处理(111)
**节D2-Index索引策略(112)
一主索引(112)
二辅助索引(117)
三索引的动态更新(123)
第二节基于D2-Index索引策略的查询处理(130)
一查询语言(130)
二查询器(133)
第三节实证研究(137)
第四节小结(140)
第七章半结构化数据与大数据(143)
**节大数据时代来临(143)
第二节大数据基础(146)
一大数据的定义(146)
二传统数据分析方法(149)
三大数据分析方法(151)
四大数据分析模式(153)
五大数据分析工具(154)
第三节大数据应用(157)
一应用演化(157)
二大数据分析的关键领域(159)
三大数据的典型应用(170)
四大数据的研究现状及发展趋势(177)
第八章总结(187)
**节主要内容(187)
第二节未来研究展望(189)
一大规模半结构化数据模式的更新(189)
二大规模半结构化数据的信息检索(190)
三分布式半结构化数据的管理(190)
参考文献(191)
在云计算和物联网等新兴信息技术高速发展的今天,由于半结构化数据具有灵活易扩展的存储结构,已被许多信息系统和应用作为公共数据模型,被广泛地用于大规模异构数据的使用场景中。几乎所有行业都制定了描述和共享本领域数据的半结构化数据模型应用标准。随着半结构化数据的广泛使用,如何对大规模半结构化数据进行有效的管理,在学术界是一个重要的研究课题,而在工业界又是一项具有广阔应用前景的技术。本书以XML为代表,探讨了大规模半结构化数据管理中的模式提取、节点编码、索引与查询处理等关键问题。本书既适合初学者作为基础学习资料,又适合科研人员作为理论研究教程,更适合从业人员作为技术参考书目。
张引(1986—),男,江西九江人,理学博士,现为中南财经政法大学计算机科学与技术系副教授、硕士生导师,长期从事认知计算与智能服务领域的研究,目前主持国家自然科学基金项目2项、教育部人文社会科学研究项目1项;近5年共发表论文80余篇,其中SCI收录超过50篇,并有9篇论文入选ESI高被引论文。在《IEEE Network》《IEEE Access》等国际知名SCI期刊担任编委等职务,曾在《Future Generation Computer Systems》《IEEE IoT Journal》《Electronic Markets》等知名SCI/SSCI期刊担任客座编辑等职务;曾在多个国际学术会议担任大会主席等职务。2014年当选IEEE计算机协会大数据技术委员会副主席,2015年当选IEEE高级会员,2016年入选中南财经政法大学“文澜学者”计划,2017年入选湖北省“楚天学者计划”,2018年获得《IEEE Systems Journal》年度论文奖。
编辑推荐生活在昂首阔步,我们在原地驻足停留,有时候,我们要学会与回忆握手言别,将爱存留于心底,带着它赐予我们的力量,前行
※随书附赫尔辛基城市设计现场导览地图北欧设计中最为极简、最具诗意的芬兰设计来自极地芬兰清透澄澈的冰雪灵感,强调创意根植于
《科学大王·植物大观》内容简介:开启神奇的植物王国之旅,从藤萝缠绕、花繁叶茂的热带雨林,到奇特的花、草、树、木、水果、蔬菜
《素手调水——茶艺茶道》内容简介:1.从茶品出发,逐渐展开了茶艺、茶道的描述。茶品中包含了茶树的生长环境和茶叶的分类以及加工
《Effective Debugging》内容简介:本书共分8章。首先讲解调试策略(第1章)、调试方法(第2章)以及调试时所用的工具与技巧(第3章
机器人技术基础 内容简介 本书系统地介绍了机器人的基础理论和关键技术。主要内容包括:机器人的机构、位姿描述和齐次变换、操作臂运动学、操作臂的雅可比、操作臂动力学...
达尔文的黑匣子:生化理论对进化论的挑战,ISBN:9787801092663,作者:(美)迈克尔·J.贝希[M.J.Behe]著;邢锡范[等]译作者简介
《梁思成中国建筑史》内容简介:★首部中国人自己书写的本民族建筑史 ★中国现代建筑学的奠基之作 ★国徽设计者、中国现代建筑之父
基于实用、实践、前瞻性、学习的原则,笔者精选了近300段JavaScript代码和400种解决方案,覆盖了几乎所有的脚本处理模块,最大程
《通信企业市场营销》结合作者多年来从事电信企业市场营销理论研究的成果,以及我国电信企业的市场营销活动和实践,论述了市场营
快学快用电脑上网技巧1088招附光盘 内容简介 本书全面介绍了电脑上网的操作技能和应用技巧,帮助读者全面、快速地掌握电脑上网的方法,提高工作效率,成为网上冲浪高...
《Java语言程序设计基础篇》(原书第5版本书是Java语言的经典教材,畅销多年不衰。本书以J2SE5.0版本为基础,采用“先讲基础”的教
《追风骑兵》内容简介:1942年,日军集结五万大军,重重包围了八路军太行山根据地。日军特战部队伪装成八路军新六旅,兵分两路,一
物联网技术概论 本书特色 彭力编著的《物联网技术概论》围绕20多个核心知识点,分为10章展开教学和物联网技术学习之旅。第1章概要介绍物联网的相关知识点,...
《Excel 2003办公应用实战从入门到精通(超值版)》内容简介:《Excel 2003办公应用实战从入门到精通(超值版)》通过精选案例引导读
《名将杨大眼》内容简介:大眼,北魏名将,中国上下五千年五百名人之一,留下的世界文化遗产《杨大眼造像记》是闻名于世的“龙门十
机器视觉技术及应用实例详解 本书特色 陈兵旗撰写的《机器视觉技术及应用实例详解》一书具有如下特点:1、通过大量的典型案例对机器视觉技术的关键点和应用方法进行了详...
Pro/ENGINEER Wildfire3.0高级实例1CD 内容简介 本书在循序渐进的教学中,通过精选的实际产品案例讲解了Pro/ENGINEER Wild...
《在家就能做的80个STEAM科学小实验》内容简介:STEAM教育是融合了科学、技术、工程、艺术、数学多门学科的综合性教育,它提倡对多
《灵魂应是可以随时飞起的鸟》内容简介:一切的驱动力,其实都是来自他那颗拳头大小的心——它微不足道,但是足够炽热,跳动有力,