本书是最全面的机器学习教材之一。书中首先介绍了机器学习的构成要素(任务、模型、特征)和机器学习任务,接着详细分析了逻辑模型(树模型、规则模型)、几何模型(线性模型和基于距离的模型)和概率模型,然后讨论了特征、模型的集成,以及被机器学习研究者称为“实验”的方法。作者不仅使用了已有术语,还引入了一些新的概念,同时提供了大量精选的示例和插图解说。
绪论 机器学习概述1
第1章 机器学习的构成要素9
1.1 任务:可通过机器学习解决的问题9
1.1.1 探寻结构11
1.1.2 性能评价13
1.2 模型:机器学习的输出14
1.2.1 几何模型14
1.2.2 概率模型17
1.2.3 逻辑模型22
1.2.4 分组模型与评分模型26
1.3 特征:机器学习的马达26
1.3.1 特征的两种用法28
1.3.2 特征的构造与变换29
1.3.3 特征之间的交互32
1.4 总结与展望33
第2章 两类分类及相关任务37
2.1 分类39
2.1.1 分类性能的评价40
2.1.2 分类性能的可视化43
2.2 评分与排序46
2.2.1 排序性能的评价及可视化48
2.2.2 将排序器转化为分类器52
2.3 类概率估计54
2.3.1 类概率估计量55
2.3.2 将排序器转化为概率估计子57
2.4 小结与延伸阅读59
第3章 超越两类分类61
3.1 处理多类问题61
3.1.1 多类分类61
3.1.2 多类得分及概率65
3.2 回归68
3.3 无监督学习及描述性学习70
3.3.1 预测性聚类与描述性聚类71
3.2.2 其他描述性模型74
3.4 小结与延伸阅读76
第4章 概念学习77
4.1 假设空间78
4.1.1 最小一般性79
4.1.2 内部析取82
4.2 通过假设空间的路径84
4.2.1 最一般相容假设86
4.2.2 封闭概念87
4.3 超越合取概念88
4.4 可学习性92
4.5 小结与延伸阅读94
第5章 树模型97
5.1 决策树100
5.2 排序与概率估计树103
5.3 作为减小方差的树学习方法110
5.3.1 回归树110
5.3.2 聚类树113
5.4 小结与延伸阅读115
第6章 规则模型117
6.1 学习有序规则列表117
6.2 学习无序规则集124
6.2.1 用于排序和概率估计的规则集128
6.2.2 深入探究规则重叠130
6.3 描述性规则学习131
6.3.1 用于子群发现的规则学习131
6.3.2 关联规则挖掘135
6.4 一阶规则学习139
6.5 小结与延伸阅读143
第7章 线性模型145
7.1 最小二乘法146
7.1.1 多元线性回归150
7.1.2 正则化回归153
7.1.3 利用最小二乘回归实现分类153
7.2 感知机155
7.3 支持向量机158
7.4 从线性分类器导出概率164
7.5 超越线性的核方法168
7.6 小结与延伸阅读170
第8章 基于距离的模型173
8.1 距离测度的多样性173
8.2 近邻与范例178
8.3 最近邻分类器182
8.4 基于距离的聚类184
8.4.1 K均值算法186
8.4.2 K中心点聚类187
8.4.3 silhouette188
8.5 层次聚类190
8.6 从核函数到距离194
8.7 小结与延伸阅读195
第9章 概率模型197
9.1 正态分布及其几何意义200
9.2 属性数据的概率模型205
9.2.1 利用朴素贝叶斯模型实现分类206
9.2.2 训练朴素贝叶斯模型209
9.3 通过优化条件似然实现鉴别式学习211
9.4 含隐变量的概率模型214
9.4.1 期望最大化算法215
9.4.2 高斯混合模型216
9.5 基于压缩的模型218
9.6 小结与延伸阅读220
第10章 特征223
10.1 特征的类型223
10.1.1 特征上的计算223
10.1.2 属性特征、有序特征及数量特征227
10.1.3 结构化特征228
10.2 特征变换229
10.2.1 阈值化与离散化229
10.2.2 归一化与标定234
10.2.3 特征缺失239
10.3 特征的构造与选择240
10.4 小结与延伸阅读243
第11章 模型的集成245
11.1 Bagging与随机森林246
11.2 Boosting247
11.3 集成学习进阶250
11.3.1 偏差、方差及裕量250
11.3.2 其他集成方法251
11.3.3 元学习252
11.4 小结与延伸阅读252
第12章 机器学习的实验255
12.1 度量指标的选择256
12.2 量指标的获取258
12.3 如何解释度量指标260
12.4 小结与延伸阅读264
后记 路在何方267
记忆要点269
参考文献271
《马勒别墅的故事》内容简介:马勒别墅坐落于上海市陕西南路30号,1927年修建,1936年竣工,主建筑呈现斯堪的那维亚挪威风格,犹如
《设计模式之禅》内容简介:全书共分为四部分,第一部分从原理的角度阐述了面向对象程序设计的6大原则;第二部生动地讲解和剖析了2
《叶秀山全集·第六卷》内容简介:本选题分类结集叶秀山先生全部已经出版的专著,在学术期刊上发表的所有论文,以及部分笔记、札记
数据库应用技术:Access2000 内容简介 MicrosoftAccess2000作为目前应用广泛的数据库管理系统,具有用户界面良好,功能强大,操作简单的优...
计算机网络安全教程-(修订本) 本书特色 《计算机网络安全教程》(修订本)在原书基础上做了大量修整和扩充,使之更加适合高校教学和自学的需要。利用大量的实例讲解知...
耸立在这里的500帧生活·读书·新知三联书店出版物的书衣,是从人民出版社和三联书店资料室的书库里,查找并拍摄的两千余件书影中
本书基于MIT(麻省理工学院)的一门课程写成,主要目标是帮助读者掌握并熟练使用各种计算技术。本书涵盖了Python的大部分特性,重
最新版BIOS与注册表现用现查 内容简介 本书是“现用现查”系列丛书之一,以问与答的形式,用精炼的语言将BIOS与注册表基本设置,以及相关应用亲切地呈现于读者面...
《中国智慧互联投资发展报告(2017)》内容简介:本书围绕智慧互联产业的内涵、体系、政策、技术以及投资发展进行了全方位的分析研
"Writtenbythreeexpertsinthefield,DeepLearningistheonlycomprehensivebookonthesubj...
《与黑天鹅共舞》内容简介:这只超级巨大的黑天鹅横空出世,瞬间让全球人紧急按下了暂停键,人类的健康与生命受到了严峻的威胁。整
《精通Python网络爬虫》内容简介:随着大数据时代的到来,我们经常需要在海量数据的互联网环境中搜集一些特定的数据并对其进行分析
《新时代与新格局》内容简介:《新时代与新格局》为何帆、朱鹤两位老师及其团队关于中国经济发展逻辑和全球经济格局的研究成果,兼
《浦东史诗》内容简介:由著名报告文学作家、中国作家协会副主席何建明精心创作的《浦东史诗》,首次以长篇报告文学形式,从经济、
Effective Objective C 2.0编写高质量iOS与OS X代码的52个有效方法-(英文版) 内容简介 本书不是在讲 Objective-C 语...
《灵魂应是可以随时飞起的鸟》内容简介:一切的驱动力,其实都是来自他那颗拳头大小的心——它微不足道,但是足够炽热,跳动有力,
《车用柴油机后处理技术》共分九章,内容包括柴油机排放后处理技术的发展,柴油机排放污染物的形成机理和危害,柴油机排放机内控
《手机摄影必修课》内容简介:本书主要内容为手机摄影的入门和进阶。内容涵盖摄影的基本概念、手机摄影对于摄影的改变、如何用手机
《时装设计元素:面料与设计》首先对时装面料史做了简单的介绍,然后描述了织物的设计过程,包括理论上的和一直持续到今天的有关织
本书以Android手机应用程序开发为主题,通过130多个范例全面且深度地整合了手机、网络及服务等多个开发领域,为读者提高程序设计