借助人工智能相关技术,帮助人们方便、高效地利用网络大数据信息,已成为当前IT业的研究热点之一。《文本大数据情感分析》介绍社交网络等海量异构信息采集算法;对文本挖掘与自然语言处理中涉及到情感分析、微博情绪诱因分析、电商产品评价与意见挖掘等内容进行研究,并提供丰富的应用案例。
借助人工智能相关技术,帮助人们方便、高效地利用网络大数据信息,已成为当前IT业的研究热点之一。本书介绍社交网络等海量异构信息采集算法;对文本挖掘与自然语言处理中涉及到情感分析、微博情绪诱因分析、电商产品评价与意见挖掘等内容进行研究,并提供丰富的应用案例。
第1章 引言
第2章 自然语言处理与应用综述
2.1 概述
2.2 自然语言处理的主要研究方法
2.2.1 理性主义与经验主义方法
2.2.2 深度学习与预训练方法及其在自然语言处理中的应用
2.3 自然语言处理的部分任务及应用
2.3.1 词法分析
2.3.2 句法分析
2.3.3 命名实体识别与特征信息提取
2.3.4 文本摘要
2.3.5 机器翻译
2.4 本章小结
参考文献
第3章 文本情感与情绪分析综述
3.1 概述
3.2 文本情感分析
3.2.1 情感信息抽取
3.2.2 情感分类
3.2.3 立场分析
3.3 文本情绪分析
3.3.1 传统的情绪分析方法
3.3.2 基于深度学习的情绪分析
3.4 本章小结
参考文献
第4章 面向微博文本的情绪及其诱因分析
4.1 总体技术路线
4.2 情绪模型
4.2.1 事件结果类
4.2.2 主体行为类
4.2.3 事件结果类和主体行为类的复合情绪
4.2.4 实体对象类
4.3 分析和提取情绪诱因事件
4.3.1 事件结果类的诱因事件分析与提取
4.3.2 主体行为类的诱因事件分析与提取
4.3.3 实体对象类的诱因事件分析与提取
4.4 情绪校验与修正
4.5 基于贝叶斯概率模型的诱因成分分析
4.5.1 基于语料的情绪词典构造
4.5.2 语言特征对情绪诱因的影响分析
4.5.3 基于贝叶斯概率模型的诱因比例计算
4.6 基于语言特征的情绪分类
4.6.1 词性特征分析
4.6.2 句法结构特征分析
4.6.3 情绪词与上下文的关系特征分析
4.6.4 特征降维
4.6.5 情绪分类
4.7 实验与分析
4.7.1 实验语料与测度说明
4.7.2 实验与结果分析
4.8 本章小结
参考文献
第5章 面向话题评论的立场分析
5.1 概述
5.2 基于AATABiLSTM模型的用户立场分析
5.2.1 基于词向量的话题扩充方法
5.2.2 基于双向LSTM与Attention的处理机制
5.2.3 实验
5.3 基于迁移学习的新话题评论预测
5.3.1 跨领域迁移学习模型的组成、预训练与预测
5.3.2 实验与分析
5.4 本章小结
参考文献
第6章 文本表示及在情绪分类中的应用
6.1 概述
6.2 基于注意力机制的双向LSTM的文本表示
6.2.1 输入层
6.2.2 特征学习层
6.2.3 特征权重学习层
6.2.4 输出层
6.2.5 实验设计与结果分析
6.2.6 基于注意力权重可视化的不同词性标签与情绪类别间的关系
6.3 基于两阶注意力机制的文本表示
6.3.1 输入层
6.3.2 特征学习层
6.3.3 特征权重学习层
6.3.4 实验与分析
6.3.5 实例分析
6.4 基于注意力聚合网络的文本表示
6.4.1 输入层
6.4.2 特征学习层
6.4.3 特征权重学习层
6.4.4 实验设计与结果分析
6.5 本章小结
参考文献
高凯,男,汉族,教授;博士毕业于上海交通大学计算机应用技术专业,省级重点学科“计算机软件与理论”中“信息检索与云计算”方向学术带头人,硕士研究生导师;中国计算机学会CCF高级会员,CCF计算机应用专委会常务委员,河北省京津冀大数据产业协会专委,河北省科技专家库成员,石家庄市工业企业特派员;国外学术期刊International Journal of Computer Applications in Technology副主编,5th /6th /7th /8thInternational Conference on Modelling, Identification and Control程序委员会委员;主要研究方向为海量异构信息处理、大数据搜索与挖掘、自然语言处理、网络信息检索、社会计算等;近几年出版了《大数据搜索与挖掘》、《信息检索与智能处理》、《网络信息检索技术及搜索引擎系统开发》等学术专著,以及《大数据搜索与日志挖掘及可视化方案》、《Android 程序设计基础教程》、《计算机专业英语》、《数据库原理与应用》多部编著和规划教材。
程序员2003合订本(上下) 本书特色 《程序员2003合订本》由程序员杂志社联合电子工业出版社*新推出。本合订本沿袭2001、2002年《程序员合订本》的风格...
《编译原理及实践》系统介绍了经典的编译理论和技术,同时也包含了面向对象语言等当前较新语言的编译技术。本书更可贵之处在于提
《心香:最难是夫妻》内容简介:本书记录了作者对亡妻一生深深的回忆——一个普通中国家庭自己的记忆:夫妻相识、结婚生子,衔草筑
本书探讨了城市化和无所不在的数字技术之间的交集,以及在这种交集中应该如何塑造我们的生活,如何引导这些历史性的力量融合,发
《iPhone开发实战》全面探讨了iPhone平台的两种编程方式——Web开发和SDK编程。全书结合示例对这两种编程方式的基本流程、基本原
这是一本专门为网页设计师赏析和借鉴服务的实用图典。本书收集了近1000个优秀网页设计的优秀瞬间,并为每个网页标注出URL、关键词
《这个世界就分两种人》内容简介:本书为作者数年来撰写的各类杂文、散文和论说文的合集。文章不长,却极有锐度,往往令读者掩卷深
《PPT演绎:故事化设计》第1版以其出色的销售成绩位列亚马逊网站畅销书榜,并且凭借其影响力成为《纽约时报》、《华尔街日报》和《
广告是一种商业活动,也是一门艺术,具有其他学科无法替代的独特性。在当今物质化、信息化并重的时代,如何形成一套更为有效的训
埋弧焊X射线焊缝图像缺陷检测算法研究 本书特色 1)基于x射线焊缝图像的埋弧焊焊缝缺陷自动检测研究现状;2)基于射线缺陷检测的概念、焊缝缺陷检测中常用的特征值,...
计算机组成及汇编语言原理英文版 内容简介 这本有创新性的书以Java虚拟机为例介绍了计算机组成及汇编语言的原理,Java虚拟机是一个极为便利、时新,可移植以及几...
《欧游杂记》内容简介:1931年8月,朱自清留学英国进修语言学和英国文学,其间漫游欧洲五国,写下数篇游记,后结集为《欧游杂记》一
《科学的故事·起源篇》内容简介:“科学”是一个翻译过来的名字,英文Science。中国早期是把它翻译成“格致学”,取“格物致知”之
《上海表情》内容简介:2020年,一场“新冠肺炎”疫情席卷全球……年初,作家何建明因疫情意外被留在了上海。在这“被留”的百余天
《复杂数据统计方法——基于r的应用》用自由的日软件分析30多个可以从国外网站下载的真实数据,包括横截面数据、纵向数据和时间序
AuthoritativebutaccessibleinformationonJavaprogrammingfundamentalsAsoneofthemost...
差不多十年前,我(Martin)曾经和KentBeck一起做过一个项目。这个项目的名字叫C3,它后来成为极限编程诞生的标志性项目,并帮助
《中国经济:警惕黑天鹅》内容简介:历史就是一系列的黑天鹅事件推动的。它的意外性、不可预见性,使得它的冲击力、影响力格外大。
世界科技界领袖级人物、掌上电脑PDA发明人杰夫•霍金斯经典力著全新升级版。详细揭示未来主流大趋势,比大数据更能决定我们生活的是
《5G时代边缘计算:LF Edge生态与EdgeGallery技术详解》内容简介:这是一本指导个人或企业针对微信视频号进行内容制作、全方位运营