语音处理及人机交互技术

语音处理及人机交互技术

作者:张毅

出版社:科学出版社

出版年:2016-03-01

评分:5分

ISBN:9787030303240

所属分类:网络科技

书刊介绍

语音处理及人机交互技术 内容简介

本书是在作者多年从事服务机器人及信息无障碍技术的基础上总结所取得的研究成果,并结合当前国际国内服务机器人方面的*新进展撰写完成的,以助老助残为目标,从老年人和残障人生理需求和心理需求出发,以服务机器人和信息无障碍技术为对象,系统地阐述了服务机器人与信息无障碍技术的基本原理与关键技术,并给出了服务机器人和信息无障碍服务系统的应用示例。

语音处理及人机交互技术 本书特色

《语音处理及人机交互技术/智能科学技术著作丛书》是在作者张毅、刘想德、罗元多年从事服务机器人及信息无障碍技术的基础上总结所取得的研究成果,并结合当前国际国内服务机器人方面的*新进展撰写完成的,以助老助残为目标,从老年人和残障人生理需求和心理需求出发,以服务机器人和信息无障碍技术为对象,系统地阐述了服务机器人与信息无障碍技术的基本原理与关键技术,并给出了服务机器人和信息无障碍服务系统的应用示例。

语音处理及人机交互技术 目录

《智能科学技术著作丛书》序前言第1章 绪论 1.1 语音信号技术的历史 1.2 语音信号技术应用及新方向1.2.1 语音信号的识别1.2.2 语音信号的合成1.2.3 语音信号的编码 参考文献第2章 语音信号的声学基础 2.1 语音信号的产生2.1.1 语音发音器官2.1.2 语音声学特征2.1.3 语音信号的时域及频域表示2.1.4 汉语语音分类2.1.5 汉语语音韵律特性 2.2 语音信号的感知2.2.1 人的听觉系统2.2.2 人耳的听觉特性2.2.3 人耳听觉的掩蔽效应 2.3 语音信号生成的数学模型2.3.1 激励模型2.3.2 声道模型2.3.3 辐射模型2.3.4 语音信号的数学模型 2.4 语音产生的非线性模型2.4.1 调频一调幅模型的基本原理2.4.2 Teager能量算子2.4.3 能量分离算法2.4.4 调频一调幅模型的应用 参考文献第3章 语音信号的分析 3.1 语音信号预处理步骤3.1.1 采样与量化3.1.2 预加重3.1.3 分帧与加窗3.1.4 端点检测 3.2 语音信号的时域分析3.2.1 短时能量分析3.2.2 短时平均过零率3.2.3 短时自相关函数和短时平均幅度差函数 3.3 语音信号的频域分析3.3.1 滤波器组方法3.3.2 傅里叶频谱分析3.3.3 线性预测倒谱系数3.3.4 Mel频率倒谱系数 3.4 语音信号的倒谱分析3.4.1 同态信号处理的基本原理3.4.2 复倒谱和倒谱 3.5 语音信号的小波分析 参考文献第4章 语音增强 4.1 语音信号与语音增强4.1.1 语音特性4.1.2 人耳感知特性4.1.3 噪声特性4.1.4 语音增强的信号模型 4.2 谱减法语音增强4.2.1 基本原理4.2.2 基本谱减法的改进 4.3 维纳滤波法语音增强 4.4 卡尔曼滤波法语音增强 4.5 *小均方误差法的语音增强 4.6 语音增强的一些新发展 参考文献第5章 模式识别算法及应用 5.1 矢量量化的基本原理 5.2 矢量量化的失真测度5.2.1 欧氏距离测度5.2.2 线性预测失真测度5.2.3 识别失真测度 5.3 人工神经网络的基本原理 5.4 人工神经网络的基本构成5.4.1 人工神经元模型5.4.2 神经网络有向图表示5.4.3 神经网络结构及工作方式 5.5 基本神经网络模型及算法5.5.1 单层感知器5.5.2 多层感知器5.5.3 径向基函数神经网络模型5.5.4 循环神经网络5.5.5 支持向量机 参考文献第6章 语音信号的识别 6.1 语音识别概述 6.2 孤立词语音识别 6.3 连续词语音识别 6.4 说话人识别6.4.1 说话人识别概述6.4.2 说话人识别特征选取6.4.3 说话人识别系统的结构6.4.4 说话人识别中的识别方法6.4.5 说话人识别中需进一步研究的问题 6.5 语音信号预处理 6.6 语音信号识别特征提取 6.7 语音信号识别方法 6.8 隐马尔可夫模型基本原理及在语音识别中的应用6.8.1 马尔可夫链6.8.2 隐马尔可夫模型的定义6.8.3 隐马尔可夫模型的三个问题6.8.4 隐马尔可夫模型在语音识别中的应用 6.9 动态时间规整算法 参考文献第7章 语音信号的合成 7.1 概述 7.2 语音合成的基本方法7.2.1 以单词为基础的合成方法7.2.2 以音节为基础的合成方法7.2.3 以音素为基础的合成方法 7.3 共振峰合成法 7.4 线性预测合成法 7.5 语音合成专用硬件介绍 7.6 PSOLA算法合成语音 7.7 文语转换系统 参考文献第8章 语音信号定位与分离技术 8.1 声源定位技术8.1.1 基于麦克风阵列的定位方法8.1.2 基于人耳听觉机理的声源定位 8.2 语音分离技术8.2.1 计算听觉场景分析8.2.2 计算听觉场景分析的语音分离模型8.2.3 独立分量分析 8.3 声源定位与语音分离实现方法 参考文献第9章 基于听觉机制的语音识别 9.1 人耳的听觉机制9.1.1 人耳听觉中枢的物理结构9.1.2 人耳听觉中枢的听觉机理 9.2 人耳听觉系统的基本模型9.2.1 人耳听觉系统的外周听觉模型9.2.2 人耳听觉系统的内毛细胞模型9.2.3 人耳听觉系统的重合神经元模型 9.3 多声源环境下人耳语音定位模型9.3.1 双耳线索9.3.2 耳廓效应9.3.3 双耳时间差模型9.3.4 多声源环境下声源定位系统的设计 9.4 多声源环境下人耳语音分离模型9.4.1 语音信号分离的反演模型9.4.2 语音信号分离系统的设计 9.5 基于听觉机制的语音识别系统 参考文献第10章 基于语音的人机交互及应用 10.1 人机交互的研究及发展10.1.1 人机交互概述10.1.2 人机交互的研究内容10.1.3 人机交互的发展历程 10.2 语音人机交互及其应用10.2.1 语音人机交互概述10.2.2 语音人机交互与智能轮椅10.2.3 语音人机交互与智能电视10.2.4 语音人机交互的其他应用 参考文献

相关推荐

微信二维码