新一代人工智能与语音识别

新一代人工智能与语音识别

作者:马延周

出版社:清华大学

出版年:2019年7月

ISBN:9787302523840

所属分类:经济金融

书刊介绍

《新一代人工智能与语音识别》内容简介

有关俄语语音识别的研究在中国尚处于起步阶段,此技术在中俄两国的民间交流和军事交往中发挥着重要作用。本书充分利用了新一代人工智能技术的研究成果,介绍了基于新闻语料的俄语连续语音识别技术。本书的目标是建立基于Kaldi环境设计并实现的俄语连续语音识别原型系统,使其同时具备在线识别功能和离线识别功能,以验证声学模型和语言模型的优化算法的有效性,进而为面向特定领域的俄语语音识别实用系统的研发提供理论方法、实验数据和关键技术支撑。为了实现上述目标,本书详细介绍了俄语语音语料的采集、加工、处理,俄语文本语料的采集、清洗、过滤,俄语发音词典的自动预测、生成,声学模型建模基本单元(音素集)的确定,声学模型和语言模型的优化。
本书可作为高等院校外国语言学及应用语言学专业、电子信息和通信类专业本科生及研究生的教学参考书,也可供语音信息处理与应用开发等领域的研究人员使用。

作品目录

内容简介

前言
第0章:绪论
0.1、研究依据
0.2、研究对象与研究目标
0.3、研究方法
0.4、研究意义
0.5、本书的创新点
0.6、语料来源
0.7、本书的结构
第1章:语音识别技术研究综述
1.1、语音识别的定义与分类
1.1.1、语音识别的定义
1.1.2、语音识别的分类
1.2、语音识别技术的研究进展
1.2.1、语音识别技术的发展概况
1.2.2、国外俄语语音识别技术的研究进展
1.2.3、中国俄语语音识别技术的研究进展
1.3、语音识别系统的基本原理
1.3.1、特征提取
1.3.2、声学模型
1.3.3、语言模型
1.3.4、解码
1.4、语音识别技术研究所关注的关键问题
本章小结
第2章:语音数据的加工处理
2.1、问题描述
2.2、众包的定义及内涵
2.2.1、众包的基本概念
2.2.2、众包的基本流程
2.2.3、众包的关键问题
2.3、解决方案
2.3.1、质量控制
2.3.2、语音标注平台的架构
2.3.3、标注平台的设计与实现
2.4、语音标注
2.4.1、语音有效性判断
2.4.2、语音转写规范
2.4.3、语音标注规范
2.5、实验设计与结果分析
2.5.1、实验设计
2.5.2、结果分析
2.5.3、结论
本章小结
第3章:俄语声学模型的建立
3.1、连续语音识别
3.1.1、连续语音识别的整体模型
3.1.2、声学模型训练的HMM-GMM方法
3.1.3、声学模型训练中的HMM-DNN方法
3.2、俄语语音学概述
3.2.1、俄语的使用及分布情况
3.2.2、俄语语音的基本特点
3.2.3、俄语音素的发音特征
3.2.4、俄语元音音素的随位变化
3.2.5、俄语辅音音素的随位变化
3.3、俄语声学单元的选择
3.3.1、俄语SAMPA音素集
3.3.2、俄语音系表
3.4、实验设计与结果分析
3.4.1、实验设计
3.4.2、结果分析
本章小结
第4章:俄语语言模型的建立
4.1、文本语料的准备与清洗
4.1.1、数据来源的筛选
4.1.2、数据爬取
4.1.3、数据的去重与清洗
4.1.4、格式化处理
4.2、语言模型简述
4.2.1、语言模型的平滑技术
4.2.2、语言模型的剪枝算法
4.3、语言模型的训练流程
4.3.1、语言模型的训练实现
4.3.2、词典的选择
4.3.3、LM的剪枝与优化
4.4、实验结果分析
4.4.1、词典规模测试
4.4.2、语料规模测试
4.4.3、语言模型剪枝测试
本章小结
第5章:基于Kaldi的俄语语音识别原型系统
5.1、系统设计的目标与原则
5.1.1、系统设计的目标
5.1.2、系统设计的原则
5.2、系统的开发环境与整体架构
5.2.1、系统的开发环境
5.2.2、系统的整体架构
5.3、Kaldi环境的搭建
5.3.1、Kaldi及实验环境
5.3.2、Kaldi训练服务器的搭建
5.3.3、AM训练数据及参数设置
5.3.4、LM训练数据及参数设置
5.4、Kaldi训练优化
5.4.1、Kaldi声学建模
5.4.2、GPU加速
5.5、语音识别原型系统的设计
5.5.1、系统GUI的设计
5.5.2、在线识别功能
5.5.3、离线识别功能
5.6、实验设计与结果分析
5.6.1、实验设计
5.6.2、实验结果
5.6.3、结果分析
本章小结
第6章:总结与展望
6.1、本书的主要成果
6.2、未来的研究计划
附录A
英汉术语对照表
附录B
其他相关资料
B.1、俄语发音词典(76277个词形)示例
B.2、俄语解码词表(189971个词形)示例
B.3、俄语字符Unicode编码对照表
B.4、俄语语音格式化程序(转换为16KB、16b)
B.5、俄语文本转Unicode编码程序
B.6、从https://twitter.com网站上下载的部分网页文件(json格式)示例
B.7、从http://www.interfax.ru网站上下载的部分网页文件(json格式)示例
B.8、俄语拉丁字母转写表
参考文献

相关推荐

微信二维码