郑泽宇,现为才云科技(Caicloud.io)联合创始人、首席大数据科学家。针对分布式TensorFlow上手难、管理难、监控难、上线难等问题,他带领团队成功开发了国内首个成熟的分布式TensorFlow深度学习平台(TensorFlow as a Service)。基于此平台,才云大数据团队为安防、电商、金融、物流等多个行业提供有针对性的人工智能解决方案。归国创业之前,郑泽宇曾任美国谷歌高级工程师。从2013 年加入谷歌,郑泽宇作为主要技术人员参与并领导了多个大数据项目。由他提出并主导的产品聚类项目用于衔接谷歌购物和谷歌知识图谱(knowledge graph)数据,使得知识卡片形式的广告逐步取代传统的产品列表广告,开启了谷歌购物广告在搜索页面投递的新纪元。郑泽宇于2011年5月获得北京大学计算机学士学位,并荣获北京大学信息科学技术学院十佳优秀毕业论文、北京大学优秀毕业生。2013年5月获得美国 Carnegie Mellon University(CMU)大学计算机硕士学位,并获得西贝尔奖学金 (Siebel Scholarship)。郑泽宇在机器学习、人工智能领域有多年研究经验,并在SIGIR、SIGKDD、ACL、ICDM、ICWSM等顶级国际会议上发表多篇学术论文。
第1章 深度学习简介 1
1.1 人工智能、机器学习与深度学习 2
1.2 深度学习的发展历程 7
1.3 深度学习的应用 10
1.3.1 计算机视觉 10
1.3.2 语音识别 14
1.3.3 自然语言处理 15
1.3.4 人机博弈 18
1.4 深度学习工具介绍和对比 19
小结 23
第2章 TensorFlow环境搭建 25
2.1 TensorFlow的主要依赖包 25
2.1.1 Protocol Buffer 25
2.1.2 Bazel 27
2.2 TensorFlow安装 29
2.2.1 使用Docker安装 30
2.2.2 使用pip安装 32
2.2.3 从源代码编译安装 33
2.3 TensorFlow测试样例 37
小结 38
第3章 TensorFlow入门 40
3.1 TensorFlow计算模型——计算图 40
3.1.1 计算图的概念 40
3.1.2 计算图的使用 41
3.2 TensorFlow数据模型——张量 43
3.2.1 张量的概念 43
3.2.2 张量的使用 45
3.3 TensorFlow运行模型——会话 46
3.4 TensorFlow实现神经网络 48
3.4.1 TensorFlow游乐场及神经网络简介 48
3.4.2 前向传播算法简介 51
3.4.3 神经网络参数与TensorFlow变量 54
3.4.4 通过TensorFlow训练神经网络模型 58
3.4.5 完整神经网络样例程序 62
小结 65
第4章 深层神经网络 66
4.1 深度学习与深层神经网络 66
4.1.1 线性模型的局限性 67
4.1.2 激活函数实现去线性化 70
4.1.3 多层网络解决异或运算 73
4.2 损失函数定义 74
4.2.1 经典损失函数 75
4.2.2 自定义损失函数 79
4.3 神经网络优化算法 81
4.4 神经网络进一步优化 84
4.4.1 学习率的设置 85
4.4.2 过拟合问题 87
4.4.3 滑动平均模型 90
小结 92
第5章 MNIST数字识别问题 94
5.1 MNIST数据处理 94
5.2 神经网络模型训练及不同模型结果对比 97
5.2.1 TensorFlow训练神经网络 97
5.2.2 使用验证数据集判断模型效果 102
5.2.3 不同模型效果比较 103
5.3 变量管理 107
5.4 TensorFlow模型持久化 112
5.4.1 持久化代码实现 112
5.4.2 持久化原理及数据格式 117
5.5 TensorFlow最佳实践样例程序 126
小结 132
第6章 图像识别与卷积神经网络 134
6.1 图像识别问题简介及经典数据集 135
6.2 卷积神经网络简介 139
6.3 卷积神经网络常用结构 142
6.3.1 卷积层 142
6.3.2 池化层 147
6.4 经典卷积网络模型 149
6.4.1 LeNet-5模型 150
6.4.2 Inception-v3模型 156
6.5 卷积神经网络迁移学习 160
6.5.1 迁移学习介绍 160
6.5.2 TensorFlow实现迁移学习 161
小结 169
第7章 图像数据处理 170
7.1 TFRecord输入数据格式 170
7.1.1 TFRecord格式介绍 171
7.1.2 TFRecord样例程序 171
7.2 图像数据处理 173
7.2.1 TensorFlow图像处理函数 174
7.2.2 图像预处理完整样例 183
7.3 多线程输入数据处理框架 185
7.3.1 队列与多线程 186
7.3.2 输入文件队列 190
7.3.3 组合训练数据(batching) 193
7.3.4 输入数据处理框架 196
小结 198
第8章 循环神经网络 200
8.1 循环神经网络简介 200
8.2 长短时记忆网络(LTSM)结构 206
8.3 循环神经网络的变种 212
8.3.1 双向循环神经网络和深层循环神经网络 212
8.3.2 循环神经网络的dropout 214
8.4 循环神经网络样例应用 215
8.4.1 自然语言建模 216
8.4.2 时间序列预测 225
小结 230
第9章 TensorBoard可视化 232
9.1 TensorBoard简介 232
9.2 TensorFlow计算图可视化 234
9.2.1 命名空间与TensorBoard图上节点 234
9.2.2 节点信息 241
9.3 监控指标可视化 246
小结 252
第10章 TensorFlow计算加速 253
10.1 TensorFlow使用GPU 253
10.2 深度学习训练并行模式 258
10.3 多GPU并行 261
10.4 分布式TensorFlow 268
10.4.1 分布式TensorFlow原理 269
10.4.2 分布式TensorFlow模型训练 272
10.4.3 使用Caicloud运行分布式TensorFlow 282
小结 287
《中国历史研究法》内容简介:《中国历史研究法》是继梁氏《新史学》后又一杰作,系以传统史学所积累的方法为基础,结合当时西方史
《Python Flask Web开发入门与项目实战》内容简介:本书从Flask框架的基础知识讲起,逐步深入到使用Flask进行Web应用开发实战。其中
《汽车标志大全.德国、法国、俄罗斯篇》内容简介:汽车品牌和它的标志是一个不可分割的整体,汽车品牌对应着标志。品牌名即是可以读
《数字化工厂+工业维修服务体系》内容简介:智能制造、工业互联网已成为中国乃至世界制造业的发展方向。制造业将在数字化、智能化方
《漫画小白学漫画,这本就够了!(基础综合)》内容简介:一直以来,漫画都受到大众的热爱和追捧,尤其是日本漫画和美国漫画。国内
《互联网+,让高血压不再可怕(在线增值版)》内容简介:高血压患者对疾病发生的原因及如何有效防控的科学知识掌握是一件很重要的事
《智能机器人养成记》内容简介:本书中,作者先描述了人工智能的缺陷(一个关键的缺点是:它没有具象化),然后提出了一种制造类人机
《老福州》内容简介:老福州三山两塔一座楼、船与海的特异文化、名人与故居、近代福州不屈的英雄气、老手艺、习俗与美食、轶闻旧事
《完美统计图》内容简介:统计图是数据可视化的主角之一,本书讲述如何制作规范的统计图。全书共分4篇,用鲜活的实例,分别讲述数据
《Essential C++中文版》内容简介:本书以四个面向来表现C++的本质:procedural(面向过程的)、generic(泛型的)、object-ba...
本书深刻且通俗地揭示JavaWeb开发内幕,使您由内而外地明白使用Java进行Web应用开发的全过程——从XML基础知识到HTTP详述及相关体
《网站分析实战:如何以数据驱动决策,提升网站价值》由王彦平、吴盛峰著。目前,越来越多的网站开始重视数据,并期望从中发现新的
《Linux实用教程(第2版)》内容简介:本书以Fedora 17为基础,在内容安排上首先从介绍和安装Linux入手,由浅至深地介绍Linux系统,
来吧!带你玩转Excel VBA(含CD光盘1张)(双色) 本书特色 全面:从录制宏开始带你步入vba殿堂详细:每个案例都详述思路与步骤贴心:提供售后服务论坛与...
《家庭预防中风100招》内容简介:全书分上下两篇。上篇主要讲述中风的基础知识,怎么去认识中风这个疾病相关的基础知识,下篇主要讲
《首席组织官》内容简介:个人充分发展、能产生知识进步和技术创新、不作恶,是本书提出的美好组织的三个标准。本书从首席组织管、
后人类文化是指以克隆为代表的生物技术和以网络、模块为代表的相关高科技技术联手缔造的、在人类社会非常有可能出现的文化景观。
《了不起的中华服饰:壮族》内容简介:本书是一套“民族文化启蒙”的通俗百科类童书,以精心绘制的插图,通俗有趣的文字,讲述了中
《解密·强直性脊柱炎》内容简介:本书从疾病的认识、诊断、治疗以及预防与康复等四个方面,对强直性脊柱炎这一困惑医患双方的医学
《企业级Java现代化:写给开发者的云原生简明指南》内容简介:《企业级Java现代化:写给开发者的云原生简明指南》讨论了如何利用现