内容简介
本书全面介绍了统计自然语言处理的基本概念、理论方法和最新研究进展,内容包括形式语言与自动机及其在自然语言处理中的应用、语言模型、隐马尔可夫模型、语料库技术、汉语自动分词与词性标注、句法分析、词义消歧、统计机器翻译、语音翻译、文本分类、信息检索与问答系统、自动文摘和信息抽取、口语信息处理与人机对话系统等,既有对基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细阐述。
本书可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的教材或参考书,也可供从事自然语言处理、数据挖掘和人工智能等研究的相关人员参考。
-------
目录
第1章 绪论
1.1 基本概念
1.1.1 语言学与语音学
1.1.2 自然语言处理
1.1.3 关于“理解”的标准
1.2 自然语言处理研究的内容和面临的困难
1.2.1 自然语言处理研究的内容
1.2.2 自然语言处理涉及的几个层次
1.2.3 自然语言处理面临的困难
1.3 自然语言处理的基本方法及其发展
1.3.1 自然语言处理的基本方法
1.3.2 自然语言处理的发展
1.4 自然语言处理的研究现状
第2章 预备知识
2.1 概率论基本概念
2.1.1 概率
2.1.2 最大似然估计
2.1.3 条件概率
2.1.4 贝叶斯法则
2.1.5 随机变量
2.1.6 二项式分布
2.1.7 联合概率分布和条件概率分布
2.1.8 贝叶斯决策理论
2.1.9 期望和方差
2.2 信息论基本概念
2.2.1 熵
2.2.2 联合熵和条件熵192.2.3 互信息
2.2.4 相对熵
2.2.5 交叉熵
2.2.6 困惑度
2.2.7 噪声信道模型
2.3 支持向量机
2.3.1 线性分类
2.3.2 线性不可分
2.3.3 构造核函数
第3章 形式语言与自动机
第4章 语料库与词汇知识库
第5章 语言模型
第6章 隐马尔可夫模型
第7章 汉语自动分词与词性标注
第8章 句法分析
第9章 语义消歧
第10章 统计机器翻译
第11章 语音翻译
第12章 文本分类
第13章 信息检索与问答系统
第14章 自动文摘与信息抽取
第15章 口语信息处理与人机对话系统
附录 项目作业
名词术语索引
参考文献
《中台产品经理》内容简介:当前互联网产业经济正面临前所未有的变革,从传统的平台经济一步步走到对传统行业进行升级赋能的环节,
Photoshop CS5数码照片处理从入门到精通-(全彩超值版)-(含1DVD) 本书特色 1张dvd光盘超值教学视频,素材和*终文件时长超过425分钟书中9...
《心理画:摆脱精神内耗的涂鸦心理学》内容简介:在生命的某个时刻,你是否怀疑过自己值不值得被爱?是否在取悦别人的过程中压抑或
Thisbookintroducesdesignthinking,thecollaborativeprocessbywhichthedesigner’ssens...
《老"码"识途:从机器码到框架的系统观逆向修炼之路》以逆向反汇编为线索,自底向上,从探索者的角度,原生态地刻画了对系统机制的
《面具与乌托邦》内容简介:★拉丁美洲哲学思想走向成熟的突破之作,开启墨西哥国民性批判先河,首次中译。★丝丝入扣揭示民族自卑
《当代设计研究理念》主要内容:设计理念和方法是当今使用者体验研究(UserExperience:Research,中文也译作“用户体验研究”)
新编Cakewalk 9.0 电脑音乐合成教程 本书特色 全面掌握Cakewalk 9.0的各种功能和制作技巧;修饰、润色制作的音乐;流行歌曲的录入、古典乐曲的...
本書從廣告、海報、書籍到雜誌,分門別類訪談相關領域箇中翹楚。報紙雜誌類──像是《紐約時報雜誌》、GQ、Esquire、Eye、Zambla
《中国人力资源和社会保障发展研究》内容简介:本书立足于新中国成立以来人力资源和社会保障的历史发展脉络,系统梳理中国企业人力
《iOS编程》荣获Jolt生产力大奖。第4版更新了iOS7和Xcode5的内容。全书涵盖了开发iOS应用的方方面面。从Objective-C基础知识到新
DigitalCommunicationsisaclassicbookintheareathatisdesignedtobeusedasaseniororgra...
《OPNETModeler与网络仿真》旨在帮助读者在阅读软件帮助文件时,更方便快捷地使用OPNETModeler(下文将其简称为OPNET)。全书共分为
互联网接入服务现状及管理对策研究 本书特色这是一部全面系统探讨互联网接入服务现状及管理对策的研究专著。佟力强编写的《互联网接入服务现状及管理对策研究》从介绍互联...
《神经科学研究与进展•神经科学MATLAB教程:MATLAB科学计算导论(英文)(导读版)》内容简介:作为科学计算的数学软件,Matlab被广泛
汇编语言(第三版) 本书特色 汇编语言是各种CPU提供的机器指令的助记符的集合,人们可以用汇编语言直接控制硬件系统进行工作。汇编语言是很多相关课程(如数据结构、...
SAP Business One 中文版7.0(SAP中小企业解决方案系列培训教材) 内容简介 本书主要由五部分组成: **部分是销售管理。它主要包括销售主数据...
《让学生快乐表达之行动研究》内容简介:2016年,世界教育创新峰会(WISE)与北京师范大学中国教育创新研究院共同发布了《面向未来
COMSOL Multiphysics工程实践与理论仿真-多物理场数值分析技术 本书特色 王刚、安琳编写的《COMSOL Multiphysics工程实践与理论...
《虚拟人》内容简介:人类躯体死亡,思维是否有可能继续存在,从而实现思维不朽?思维克隆人、网络人等虚拟人将如何颠覆人类对“我