本书是最全面的机器学习教材之一。书中首先介绍了机器学习的构成要素(任务、模型、特征)和机器学习任务,接着详细分析了逻辑模型(树模型、规则模型)、几何模型(线性模型和基于距离的模型)和概率模型,然后讨论了特征、模型的集成,以及被机器学习研究者称为“实验”的方法。作者不仅使用了已有术语,还引入了一些新的概念,同时提供了大量精选的示例和插图解说。
绪论 机器学习概述1
第1章 机器学习的构成要素9
1.1 任务:可通过机器学习解决的问题9
1.1.1 探寻结构11
1.1.2 性能评价13
1.2 模型:机器学习的输出14
1.2.1 几何模型14
1.2.2 概率模型17
1.2.3 逻辑模型22
1.2.4 分组模型与评分模型26
1.3 特征:机器学习的马达26
1.3.1 特征的两种用法28
1.3.2 特征的构造与变换29
1.3.3 特征之间的交互32
1.4 总结与展望33
第2章 两类分类及相关任务37
2.1 分类39
2.1.1 分类性能的评价40
2.1.2 分类性能的可视化43
2.2 评分与排序46
2.2.1 排序性能的评价及可视化48
2.2.2 将排序器转化为分类器52
2.3 类概率估计54
2.3.1 类概率估计量55
2.3.2 将排序器转化为概率估计子57
2.4 小结与延伸阅读59
第3章 超越两类分类61
3.1 处理多类问题61
3.1.1 多类分类61
3.1.2 多类得分及概率65
3.2 回归68
3.3 无监督学习及描述性学习70
3.3.1 预测性聚类与描述性聚类71
3.2.2 其他描述性模型74
3.4 小结与延伸阅读76
第4章 概念学习77
4.1 假设空间78
4.1.1 最小一般性79
4.1.2 内部析取82
4.2 通过假设空间的路径84
4.2.1 最一般相容假设86
4.2.2 封闭概念87
4.3 超越合取概念88
4.4 可学习性92
4.5 小结与延伸阅读94
第5章 树模型97
5.1 决策树100
5.2 排序与概率估计树103
5.3 作为减小方差的树学习方法110
5.3.1 回归树110
5.3.2 聚类树113
5.4 小结与延伸阅读115
第6章 规则模型117
6.1 学习有序规则列表117
6.2 学习无序规则集124
6.2.1 用于排序和概率估计的规则集128
6.2.2 深入探究规则重叠130
6.3 描述性规则学习131
6.3.1 用于子群发现的规则学习131
6.3.2 关联规则挖掘135
6.4 一阶规则学习139
6.5 小结与延伸阅读143
第7章 线性模型145
7.1 最小二乘法146
7.1.1 多元线性回归150
7.1.2 正则化回归153
7.1.3 利用最小二乘回归实现分类153
7.2 感知机155
7.3 支持向量机158
7.4 从线性分类器导出概率164
7.5 超越线性的核方法168
7.6 小结与延伸阅读170
第8章 基于距离的模型173
8.1 距离测度的多样性173
8.2 近邻与范例178
8.3 最近邻分类器182
8.4 基于距离的聚类184
8.4.1 K均值算法186
8.4.2 K中心点聚类187
8.4.3 silhouette188
8.5 层次聚类190
8.6 从核函数到距离194
8.7 小结与延伸阅读195
第9章 概率模型197
9.1 正态分布及其几何意义200
9.2 属性数据的概率模型205
9.2.1 利用朴素贝叶斯模型实现分类206
9.2.2 训练朴素贝叶斯模型209
9.3 通过优化条件似然实现鉴别式学习211
9.4 含隐变量的概率模型214
9.4.1 期望最大化算法215
9.4.2 高斯混合模型216
9.5 基于压缩的模型218
9.6 小结与延伸阅读220
第10章 特征223
10.1 特征的类型223
10.1.1 特征上的计算223
10.1.2 属性特征、有序特征及数量特征227
10.1.3 结构化特征228
10.2 特征变换229
10.2.1 阈值化与离散化229
10.2.2 归一化与标定234
10.2.3 特征缺失239
10.3 特征的构造与选择240
10.4 小结与延伸阅读243
第11章 模型的集成245
11.1 Bagging与随机森林246
11.2 Boosting247
11.3 集成学习进阶250
11.3.1 偏差、方差及裕量250
11.3.2 其他集成方法251
11.3.3 元学习252
11.4 小结与延伸阅读252
第12章 机器学习的实验255
12.1 度量指标的选择256
12.2 量指标的获取258
12.3 如何解释度量指标260
12.4 小结与延伸阅读264
后记 路在何方267
记忆要点269
参考文献271
《50件改变世界的裙装》讲述了:你不必是一个追逐时尚的人,或是设计爱好者,也不用奢望一件裙装就能改变整个社会。阅读本书即是
《随机信号分析基础(第3版)》为普通高等教育“十一五”国家级规划教材。《随机信号分析基础(第3版)》主要从工程应用的角度讨论随
《世界大学生程序设计竞赛(ACM/ICPC)高级教程(第1册):程序设计中常用的计算思维方式》主要介绍了大赛程序设计中的常用思维方式,
计算机网络(第五版) 本书特色 《计算机网络》为普通高等教育“十一五”国家级规划教材。本书共分十章,主要介绍了计算机网络的发展和原理体系结构、物理层、数据链路层...
《黑洞旅行指南》内容简介:这本引人入胜的科普小书解读了当代科学里极具挑战性的现象—黑洞,它也是我们理解整个宇宙的方向标。在
Geomagic Studio逆向工程技术及应用-(含光盘) 本书特色 《Geomagic Studio逆向工程技术及应用》是由清华大学出版社出版的。Geoma...
《找对人:企业人才招聘与选拔方法精要》内容简介:本书聚焦企业“选人”之道。书中对人才标准的制定、人才的来源、人才招聘和选拔
《2017年MBA、MPA、MPAcc管理类联考英语历年真题详解》内容简介:本书对MBA联考英语历年真题给予了系统分析和解答,并总结和归纳了
《对比Excel,轻松学习SQL数据分析》内容简介:本书是《对比Excel,轻松学习Python数据分析》的姊妹篇,同样采用对比的方法,降低学
《高校辅导员工作案例精选》内容简介:本书是大学生思想政治工作案例集合,涉及学生思想政治教育、党团和班级建设、学业指导、日常
《PLC教程(第3版)》是一本在国外广受欢迎的PLC教材。《PLC教程(第3版)》从PLC的共性特征出发,重点讲述PLC的基本工作原理,并提供
《HTML+XHTML+CSS+JavaScript+DOM+AJAX语法及范例实用辞典》是一本系统、全面的语法和范例辞典,详尽介绍了HTML、XHTML、CS...
《知道点世界哲学》内容简介:是谁提出“人不能两次踏进同一条河流”?为什么斯宾诺莎是被骂名包围的哲学家?俄罗斯的飞翔的双头鹰
※随书附赫尔辛基城市设计现场导览地图北欧设计中最为极简、最具诗意的芬兰设计来自极地芬兰清透澄澈的冰雪灵感,强调创意根植于
《游戏设计:深层设计思想与技巧》内容简介:本书是游戏设计行业的专业书籍,讲述游戏设计的方方面面,从基础的玩法和难度设计(包
《Kali Linux 高级渗透测试(原书第3版)》内容简介:Kali Linux面向专业的渗透测试和安全审计,集成了大量精心挑选的安全检测工具
精通UG NX5中文版-基础入门篇(附赠1CD.含4小时语音视频教学) 内容简介 全书共分14章,主要介绍了ug nx5的绘图命令、实体特征以及各项命令的操作与...
Python可以这样学 本书特色 全书共分16章,对Python内部工作原理进行了一定深度的剖析,99%以上的案例代码使用Python 3.5.1实现,也适用于...
《Android开发实战》内容简介:本书由一线资深软件开发工程师基于目前广泛使用的Android 6/7和Android Studio 2.x开发环境倾力编撰
时至今日,Linux系统已经从一个个人作品发展为可以用于各种关键任务的成熟、高效和稳定的操作系统,因为具备跨平台、开源、支持众