TensorFlow语音识别实战

TensorFlow语音识别实战

作者:王晓华

出版社:清华大学

出版年:2021年7月

ISBN:9787302584858

所属分类:行业好书

书刊介绍

《TensorFlow语音识别实战》内容简介

《TensorFlow语音识别实战/人工智能技术丛书》使用新的TensorFlow2作为语音识别的基本框架,引导读者入门并掌握基于深度学习的语音识别基本理论、概念以及实现实际项目。
《TensorFlow语音识别实战/人工智能技术丛书》内容循序渐进,从搭建环境开始,逐步深入理论、代码及应用实践,是语音识别技术图书的好选择。
《TensorFlow语音识别实战/人工智能技术丛书》分为10章,内容包括语音识别概况与开发环境搭建、TensorFlow和Keras、深度学习的理论基础、卷积层与MNIST实战、TensorFlowDatasets和TensorBoard详解、ResNet模型、使用循环神经网络的语音识别实战、有趣的词嵌入实战、语音识别中的转换器实战、语音汉字转换实战。
《TensorFlow语音识别实战/人工智能技术丛书》内容详尽、示例丰富,适合作为语音识别和深度学习初学者必备的参考书,同时非常适合作为高等院校和培训机构人工智能及相关专业师生的参考教材。
王晓华,计算机专业讲师,长期讲授面向对象程序设计、数据结构、Hadoop程序设计等研究生和本科生相关课程;主要研究方向为云计算、数据挖掘。曾主持和参与多项国家和省级科研课题,独立科研项目获省级成果认定,发表过多篇论文,拥有一项国家专利。著有《Spark MLlib机器学习实践》《TensorFlow深度学习应用实践》《OpenCV+TensorFlow深度学习与计算机视觉实战》《TensorFlow2.0卷积神经网络实战》《TensorFlow+Keras自然语言处理实战》等图书。

作品目录

内容简介
前言
本书特色
本书内容及知识体系
适合阅读本书的读者
源码、数据集、开发环境下载和技术支持
勘误和鸣谢
第1章:语音识别之路
1.1、何谓语音识别
1.2、语音识别为什么难——语音识别的发展历程
1.3、语音识别商业化之路的三个关键节点
1.4、语音识别的核心技术与行业发展趋势
1.5、搭建环境1:安装Python
1.6、搭建环境2:安装TensorFlow
2.1、1.7、实战——基于特征词的语音唤醒
1.8、本章小结
第2章:TensorFlow和Keras
2.1、TensorFlow和Keras
2.2、全连接层详解
2.3、懒人的福音——Keras模型库
2.4、本章小结
第3章:深度学习的理论基础
3.1、BP神经网络简介
3.2、BP神经网络两个基础算法详解
3.3、反馈神经网络反向传播算法
3.4、本章小结
第4章:卷积层与MNIST实战
4.1、卷积运算的基本概念
4.2、编程实战:MNIST手写体识别
4.3、本章小结
第5章:TensorFlow
Datasets和TensorBoard详解
5.1、TensorFlow
Datasets简介
5.2、Datasets数据集的使用——FashionMNIST
5.3、使用Keras对FashionMNIST数据集进行处理
5.4、使用TensorBoard可视化训练过程
5.5、本章小结
第6章:从冠军开始:ResNet
6.1、ResNet基础原理与程序设计基础
6.2、ResNet实战:CIFAR-100数据集分类
6.3、ResNet的兄弟——ResNeXt
6.4、本章小结
第7章:使用循环神经网络的语音识别实战
7.1、使用循环神经网络的语音识别
7.2、长短期记忆网络
7.3、GRU层详解
7.4、站在巨人肩膀上的语音识别
7.5、本章小结
第8章:梅西-阿根廷+意大利=?:有趣的词嵌入实战
8.1、文本数据处理
8.2、更多的Word
Embedding方法——fastText和预训练词向量
8.3、针对文本的卷积神经网络模型:字符卷积
8.4、针对文本的卷积神经网络模型:词卷积
8.5、使用卷积对文本分类的补充内容
8.6、本章小结
第9章:从拼音到汉字——语音识别中的转换器
9.1、编码器的核心:注意力模型
9.2、构建编码器架构
9.3、实战编码器——汉字拼音转化模型
9.4、本章小结
第10章:实战——基于MFCC和CTC的语音汉字转换
10.1、语音识别的理论基础1——MFCC
10.2、语音识别的理论基础2——CTC
10.3、实战——语音汉字转换
10.4、本章小结

相关推荐

微信二维码