中文科研领域命名实体知识图谱的构建与应用

中文科研领域命名实体知识图谱的构建与应用

作者:王瑞云

出版社:中国财政经济出版社

出版年:2018-09-01

评分:5分

ISBN:9787509587201

所属分类:教辅教材

书刊介绍

中文科研领域命名实体知识图谱的构建与应用 内容简介

本书以互联网Web2.0为背景分析了科研领域命名实体知识图谱基于语义网技术的构建与应用。首先,梳理了国内外语义网的研究框架与重要应用技术的文献;其次分析中文命名实体在图书期刊、科研会议、专利管理和商业网络知识库等领域的应用现状、取得成果及其存在的问题;第三,针对上述问题,分析借用国外网络知识技术方法和应用,借鉴国外知识库联合协作的开发运营理念;第四,研究中文命名实体知识图谱的顶层框架,主要的实体类别和实体间的关系;第五在前面研究的基础上提出基于异质网络聚合的知识图谱构建方法和应用策略。

中文科研领域命名实体知识图谱的构建与应用 本书特色

本书以互联网Web2.0为背景分析了科研领域命名实体知识图谱基于语义网技术的构建与应用。首先,梳理了国内外语义网的研究框架与重要应用技术的文献;其次分析中文命名实体在图书期刊、科研会议、专利管理和商业网络知识库等领域的应用现状、取得成果及其存在的问题;第三,针对上述问题,分析借用国外网络知识技术方法和应用,借鉴国外知识库联合协作的开发运营理念;第四,研究中文命名实体知识图谱的顶层框架,主要的实体类别和实体间的关系;第五在前面研究的基础上提出基于异质网络聚合的知识图谱构建方法和应用策略。

中文科研领域命名实体知识图谱的构建与应用 目录

第1章绪论1.1知识图谱与命名实体1.1.1知识图谱的概念1.1.2命名实体的知识图谱构建1.1.3国内外命名实体的知识图谱构建1.2中文网络知识库存在的问题与研究的意义1.2.1海量信息与“信息孤岛”的问题1.2.2本书的研究意义1.3关联数据语义化聚簇研究综述1.3.1虚拟国际规范档VIAF关联数据研究1.3.2Wikipedia及其系列项目知识库研究1.3.3语义化基础工具的研究1.3.4LDA主题模型1.4本书的研究内容和研究路线第2章基础理论2.1语义Web的构成2.1.1RDF与关系数据库2.1.2网络本体语言OWL与本体的构建与应用2.1.3语义推理应用2.1.4基于数学关系的本体定义和逻辑公式2.2规范数据和关联数据2.2.1规范数据的描述格式2.2.2规范数据的关联2.2.3跨语言的一体化关联数据Wikidata2.3语义聚簇2.3.1VIAF初期项目分析一连接德意志图书馆和美国国会图书馆的规范文档2.3.2VIAF周期性关联实践的算法流程及歧义处理2.3.3VIAF独立网站服务开通的运营分析2.3.4VIAF与Wikidata的结合实践与发展趋势2.4基于主题模型的语义化2.4.1LDA输入2.4.2LDA的假设2.4.3LDA的图形表示与生成模型表示2.4.4LDA的参数估计2.4.5LDA的新样本推断2.5异构知识库的实体定义与识别2.5.1使用RDF模式定义知识库的实体、属性及实体问的关系2.5.2命名实体知识图谱的类层次定义与实例构建2.5.3中文命名实体的对齐2.5.4中文命名实体的识别困难2.6小结第3章基于个人属性表的中文个人名称规范记录聚簇3.1名称规范记录与规范控制3.1.1CNASS结果集记录未聚簇的问题分析3.1.2国内学者对名称记录聚簇的研究3.1.3VIAF匹配算法的参考3.2规范记录实体匹配分析3.2.1CNASS检索结果集总体特征3.2.2中文名称规范记录的各级表示方法3.2.3VIAF聚簇内详细内容和结构分析3.2.4不同中文规范数据库的特征比较3.2.5中文名称规范记录的匹配枪索点的构建3.3自动聚簇方法与实现3.3.1数据库表的构建3.3.2数据预处理3.3.3名称实体匹配和聚簇算法3.3.4聚簇结果分析3.3.5聚簇结果与VIAF匹配聚簇验证3.4小结第4章基于作品关系扩展的中文个人名称规范记录聚簇4.1名称规范记录的FRBR语义化表示4.2中文个人名称规范记录聚簇的E—R分析4.2.1中文个人名称规范记录的实体分析4.2.2中文个人名称规范记录的实体关系分析4.3基于作品关系扩展的中文个人名称规范记录聚簇算法4.3.1基于外部关联记录的作品关系属性扩展4.3.2基于作品关系扩展的中文个人名称记录识别与聚簇算法4.4中文个人名称规范记录聚簇实验4.4.1实验聚簇结果的评价指标和描述统计分析4.4.2聚簇的综合效果分析4.4.3聚簇实验结果分析4.5利用虚拟国际规范档的Ccs记录进行关联扩展4.5.1CCS规范记录号能否重定向到VIAF聚簇4.5.2VIAF聚簇中的ccs记录的特征研究4.6小结第5章基于WiKidata的个人职业本体构建5.1中文名称规范检索系统结果集附加信息识别问题5.2wikidata个人名称数据的职业表示方法5.3基于准马尔可夫过程的职业层次关系分析5.3.1职业条目数据的获取5.3.2职业上位关系的矩阵表示与特征研究5.3.3职业上位关系矩阵的准马尔可夫转化5.3.4结果分析5.4中文个人职业本体的推导5.5小结与展望第6章基于主题模型识别的个人名称规范记录聚簇6.1基于主题模型的记录语义结构化问题6.2中文个人名称规范记录的主题模型构建6.2.1中文个人名称规范记录的主题特征分析6.2.2主题框架构建6.2.3主题词抽取方法6.2.4基于主题词方法的案例6.3实验和结果分析6.4小结第7章机构实体知识库构建研究7.1基于名称的机构识别方法7.1.1名称文本近似度识别7.1.2曾用名表简称表识别7.1.3分段识别7.1.4总体分支语义关联识别7.2参考知识库的机构7.2.1中文名称规范数据库的机构查询分析7.2.2虚拟国际规范档的机构7.2.3百度百科的机构分析7.2.4维基数据的机构7.3机构实体的分析与构建7.3.1机构的概念7.3.2机构的分类及类层次关系7.3.3机构实例库的初步构建7.3.4机构库实体结点构建7.3.5机构库实例结点与外部知识库的实例等同关系构建7.4命名实体知识图谱概念层次定义和实例构建7.5小结第8章研究结论、局限与展望8.1研究结论8.2研究局限与展望附录A个人名称检索语料附录B示例:Amarc3—005.XML文件内容附录C初步收集科研实体机构一总体机构名称表附录D本书术语的中英文对应表参考文献后记

中文科研领域命名实体知识图谱的构建与应用 作者简介

王瑞云,主要研究特长:语义网知识管理与信息经济。山西省太原市坞城路92号山西大学经济与管理学院。讲师。

相关推荐

微信二维码