借助人工智能相关技术,帮助人们方便、高效地利用网络大数据信息,已成为当前IT业的研究热点之一。《文本大数据情感分析》介绍社交网络等海量异构信息采集算法;对文本挖掘与自然语言处理中涉及到情感分析、微博情绪诱因分析、电商产品评价与意见挖掘等内容进行研究,并提供丰富的应用案例。
借助人工智能相关技术,帮助人们方便、高效地利用网络大数据信息,已成为当前IT业的研究热点之一。本书介绍社交网络等海量异构信息采集算法;对文本挖掘与自然语言处理中涉及到情感分析、微博情绪诱因分析、电商产品评价与意见挖掘等内容进行研究,并提供丰富的应用案例。
第1章 引言
第2章 自然语言处理与应用综述
2.1 概述
2.2 自然语言处理的主要研究方法
2.2.1 理性主义与经验主义方法
2.2.2 深度学习与预训练方法及其在自然语言处理中的应用
2.3 自然语言处理的部分任务及应用
2.3.1 词法分析
2.3.2 句法分析
2.3.3 命名实体识别与特征信息提取
2.3.4 文本摘要
2.3.5 机器翻译
2.4 本章小结
参考文献
第3章 文本情感与情绪分析综述
3.1 概述
3.2 文本情感分析
3.2.1 情感信息抽取
3.2.2 情感分类
3.2.3 立场分析
3.3 文本情绪分析
3.3.1 传统的情绪分析方法
3.3.2 基于深度学习的情绪分析
3.4 本章小结
参考文献
第4章 面向微博文本的情绪及其诱因分析
4.1 总体技术路线
4.2 情绪模型
4.2.1 事件结果类
4.2.2 主体行为类
4.2.3 事件结果类和主体行为类的复合情绪
4.2.4 实体对象类
4.3 分析和提取情绪诱因事件
4.3.1 事件结果类的诱因事件分析与提取
4.3.2 主体行为类的诱因事件分析与提取
4.3.3 实体对象类的诱因事件分析与提取
4.4 情绪校验与修正
4.5 基于贝叶斯概率模型的诱因成分分析
4.5.1 基于语料的情绪词典构造
4.5.2 语言特征对情绪诱因的影响分析
4.5.3 基于贝叶斯概率模型的诱因比例计算
4.6 基于语言特征的情绪分类
4.6.1 词性特征分析
4.6.2 句法结构特征分析
4.6.3 情绪词与上下文的关系特征分析
4.6.4 特征降维
4.6.5 情绪分类
4.7 实验与分析
4.7.1 实验语料与测度说明
4.7.2 实验与结果分析
4.8 本章小结
参考文献
第5章 面向话题评论的立场分析
5.1 概述
5.2 基于AATABiLSTM模型的用户立场分析
5.2.1 基于词向量的话题扩充方法
5.2.2 基于双向LSTM与Attention的处理机制
5.2.3 实验
5.3 基于迁移学习的新话题评论预测
5.3.1 跨领域迁移学习模型的组成、预训练与预测
5.3.2 实验与分析
5.4 本章小结
参考文献
第6章 文本表示及在情绪分类中的应用
6.1 概述
6.2 基于注意力机制的双向LSTM的文本表示
6.2.1 输入层
6.2.2 特征学习层
6.2.3 特征权重学习层
6.2.4 输出层
6.2.5 实验设计与结果分析
6.2.6 基于注意力权重可视化的不同词性标签与情绪类别间的关系
6.3 基于两阶注意力机制的文本表示
6.3.1 输入层
6.3.2 特征学习层
6.3.3 特征权重学习层
6.3.4 实验与分析
6.3.5 实例分析
6.4 基于注意力聚合网络的文本表示
6.4.1 输入层
6.4.2 特征学习层
6.4.3 特征权重学习层
6.4.4 实验设计与结果分析
6.5 本章小结
参考文献
高凯,男,汉族,教授;博士毕业于上海交通大学计算机应用技术专业,省级重点学科“计算机软件与理论”中“信息检索与云计算”方向学术带头人,硕士研究生导师;中国计算机学会CCF高级会员,CCF计算机应用专委会常务委员,河北省京津冀大数据产业协会专委,河北省科技专家库成员,石家庄市工业企业特派员;国外学术期刊International Journal of Computer Applications in Technology副主编,5th /6th /7th /8thInternational Conference on Modelling, Identification and Control程序委员会委员;主要研究方向为海量异构信息处理、大数据搜索与挖掘、自然语言处理、网络信息检索、社会计算等;近几年出版了《大数据搜索与挖掘》、《信息检索与智能处理》、《网络信息检索技术及搜索引擎系统开发》等学术专著,以及《大数据搜索与日志挖掘及可视化方案》、《Android 程序设计基础教程》、《计算机专业英语》、《数据库原理与应用》多部编著和规划教材。
Inthisbook,notedwebdeveloperandlongtimeWaSPmemberJohnAllsopteachesallyouneedtokn...
《销售冠军是如何炼成的》内容简介:销售既是一份充满挑战的工作, 更是一项伟大而光荣的事业! 茫茫人海,你要寻找的精准客户在哪
JakartaTomcat是世界上使用最广的Javaservlet与JSP平台。除了作为Sun公司servlet及JSP规格的参考实现之外,在几十万个网站中也占
《抗战时代生活史》内容简介:本书是“陈存仁作品”之一本,与《银元时代生活史》可以看作是作者自传两部曲。书中描写了上海沦陷后
《海蒂育儿大百科:0~1岁(2023版)》内容简介:宝宝不会带着说明书来到这个世界,新手父母难免遇到各种问题。这时,一部专业可靠的
《茅理翔:创业式传承》内容简介:家族企业的传承已经成为民企发展过程中的一道难题,方太集团茅氏父子用自己的人生经验和智慧,给
《所罗门王的宝藏》内容简介:犹太民族的所罗门国王既是智慧的代表,又是财富的象征。他死后多少个世纪以来,人们一直在寻找这批古
《人间值得一回游》内容简介:任凭心中涌起孤独万种,观照尘世依然欢喜如初。散文大家刘白羽一生写出了大量具有深刻思想内涵和独特
计算机组成原理(第2版) 本书特色 本书系统地介绍了计算机的组成及其工作原理。全书共分7章,第1章概要介绍计算机的硬件结构、工作过程及性能指标;第2章介绍数据的...
数据聚类 本书特色 聚类是数据挖掘领域的一个重要分支。本书全面系统地介绍聚类的主要方法。首先,对涉及聚类的各个方面进行简略的综述;然后,对各类聚类算法进行较详细...
《长皱了的小孩》内容简介:摄影家严明继畅销书《我爱这哭不出来的浪漫》《大国志》后的最新随笔集,成长三部曲完结篇。作者用温暖
《36讲资治通鉴通识课:1362年历史时空》内容简介:《资治通鉴》是北宋司马光主编的中国首部编年体通史,是传统的史学巅峰著作,但
本书是一本广受好评的Cassandra图书。与传统的关系型数据库不同,Cassandra是一种开源的分布式存储系统。书中介绍了它无中心架构
Access活用范例大辞典-全新版-(附赠光盘) 本书特色 本书侧重于access的基础应用技巧,共11章,分为四大部分:**部分为第1~4章,着重介绍acce...
《北山酒经(外二种)》内容简介:本书系统总结了前代有关饮酒、酿酒、制曲的重要理论,详述制曲技术与酿酒的工艺过程及各种酒的酿
《金蔷薇》内容简介:《金蔷薇》是一部总结作者本人创作经验、研究俄罗斯和世界上许多文学大师的创作活动、探讨文学创作的过程、方
Machinelearningisoneofthefastestgrowingareasofcomputerscience,withfar-reachingap...
《企业应用架构模式经典重读》内容简介:本书作者是当今面向对象软件开发的权威,他在一组专家级合作者的帮助下,将40多种经常出现
本报告在《创新2050:科学技术与中国的未来》科技发展路线图和学科发展研究的基础上,前瞻未来10年世界科技发展,提出在一些重要
《减肥侠》内容简介:在追求身材的道路上,熊顿从一开始盲目到发现适合自己的低成本、健康安全方法,也在过程中树立了坚持的信心,