半结构化数据管理关键算法研究与实证

半结构化数据管理关键算法研究与实证

作者:张引

出版社:中国社会科学出版社

出版年:2018-08-01

评分:5分

ISBN:9787520325059

所属分类:网络科技

书刊介绍

半结构化数据管理关键算法研究与实证 目录

**章半结构化数据的应用背景(1)

**节研究背景(2)

第二节研究内容及意义(6)

一 研究内容(6)

二 研究意义(8)

第三节本书结构(9)

第二章半结构化数据的基础知识(12)

**节半结构化数据的结构特征(12)

第二节半结构化数据的结构模型(15)

第三节半结构化数据的模式语言(16)

第四节半结构化数据的查询语言(17)

第五节半结构化数据的应用程序接口(19)

第三章半结构化数据的管理模型(22)

**节半结构化数据模式提取的相关研究(23)

第二节半结构化数据节点编码的相关研究(26)

第三节半结构化数据索引的相关研究(27)

第四节半结构化数据查询处理的相关研究(30)

第四章半结构化数据的模式提取(33)

**节半结构化数据的元素内容模型(34)

一半结构化数据的树状结构模型(34)

二半结构化数据的元素内容模型(36)

三提取大规模半结构化数据模式的质量标准(38)

第二节基于正则表达式的模式提取方法(39)

一元素内容模型的正则表示(39)

二XStruct算法简介(42)

三XStruct算法的优缺点(46)

第三节基于集合/序列的模式提取方法——XTree(48)

一XTree算法的组成(48)

二基于集合/序列的元素内容模型(50)

三XTree的数据结构(51)

四提取元素内容模型(55)

五识别数据类型(57)

六提取属性(58)

七输出模式(59)

第四节实证研究(59)

一XTree的算法的时间和空间复杂度分析(60)

二元素内容模型的有序性判断对模式准确性的影响(61)

三实验环境及测试工具(63)

四测试数据集(64)

五提取不同文档的模式的时间和内存

消耗以及准确性(67)

六XTree算法提取同结构的不同大小的数据

模式的时间消耗(71)

第五节小结(72)

第五章半结构化数据的节点编码(75)

**节半结构化数据节点编码的特点(76)

一半结构化数据节点编码的质量评价标准(76)

二基于区间的节点编码方案(77)

三基于前缀的节点编码方案(82)

四ORDPATH编码方案(85)

第二节D2编码方案(89)

一D2编码方案的基本概念(89)

二静态D2编码(92)

三动态D2编码(94)

第三节D2编码的二进制表示(95)

一D2编码的二进制表示(96)

二D2物理编码的比较(102)

第四节实证研究(106)

一D2物理编码长度分析(106)

二D2物理编码长度实验(107)

第五节小结(109)

第六章半结构化数据的索引和查询处理(111)

**节D2-Index索引策略(112)

一主索引(112)

二辅助索引(117)

三索引的动态更新(123)

第二节基于D2-Index索引策略的查询处理(130)

一查询语言(130)

二查询器(133)

第三节实证研究(137)

第四节小结(140)

第七章半结构化数据与大数据(143)

**节大数据时代来临(143)

第二节大数据基础(146)

一大数据的定义(146)

二传统数据分析方法(149)

三大数据分析方法(151)

四大数据分析模式(153)

五大数据分析工具(154)

第三节大数据应用(157)

一应用演化(157)

二大数据分析的关键领域(159)

三大数据的典型应用(170)

四大数据的研究现状及发展趋势(177)

第八章总结(187)

**节主要内容(187)

第二节未来研究展望(189)

一大规模半结构化数据模式的更新(189)

二大规模半结构化数据的信息检索(190)

三分布式半结构化数据的管理(190)

参考文献(191)

半结构化数据管理关键算法研究与实证 内容简介

在云计算和物联网等新兴信息技术高速发展的今天,由于半结构化数据具有灵活易扩展的存储结构,已被许多信息系统和应用作为公共数据模型,被广泛地用于大规模异构数据的使用场景中。几乎所有行业都制定了描述和共享本领域数据的半结构化数据模型应用标准。随着半结构化数据的广泛使用,如何对大规模半结构化数据进行有效的管理,在学术界是一个重要的研究课题,而在工业界又是一项具有广阔应用前景的技术。本书以XML为代表,探讨了大规模半结构化数据管理中的模式提取、节点编码、索引与查询处理等关键问题。本书既适合初学者作为基础学习资料,又适合科研人员作为理论研究教程,更适合从业人员作为技术参考书目。

半结构化数据管理关键算法研究与实证 作者简介

张引(1986—),男,江西九江人,理学博士,现为中南财经政法大学计算机科学与技术系副教授、硕士生导师,长期从事认知计算与智能服务领域的研究,目前主持国家自然科学基金项目2项、教育部人文社会科学研究项目1项;近5年共发表论文80余篇,其中SCI收录超过50篇,并有9篇论文入选ESI高被引论文。在《IEEE Network》《IEEE Access》等国际知名SCI期刊担任编委等职务,曾在《Future Generation Computer Systems》《IEEE IoT Journal》《Electronic Markets》等知名SCI/SSCI期刊担任客座编辑等职务;曾在多个国际学术会议担任大会主席等职务。2014年当选IEEE计算机协会大数据技术委员会副主席,2015年当选IEEE高级会员,2016年入选中南财经政法大学“文澜学者”计划,2017年入选湖北省“楚天学者计划”,2018年获得《IEEE Systems Journal》年度论文奖。

相关推荐

微信二维码