本书是最全面的机器学习教材之一。书中首先介绍了机器学习的构成要素(任务、模型、特征)和机器学习任务,接着详细分析了逻辑模型(树模型、规则模型)、几何模型(线性模型和基于距离的模型)和概率模型,然后讨论了特征、模型的集成,以及被机器学习研究者称为“实验”的方法。作者不仅使用了已有术语,还引入了一些新的概念,同时提供了大量精选的示例和插图解说。
绪论 机器学习概述1
第1章 机器学习的构成要素9
1.1 任务:可通过机器学习解决的问题9
1.1.1 探寻结构11
1.1.2 性能评价13
1.2 模型:机器学习的输出14
1.2.1 几何模型14
1.2.2 概率模型17
1.2.3 逻辑模型22
1.2.4 分组模型与评分模型26
1.3 特征:机器学习的马达26
1.3.1 特征的两种用法28
1.3.2 特征的构造与变换29
1.3.3 特征之间的交互32
1.4 总结与展望33
第2章 两类分类及相关任务37
2.1 分类39
2.1.1 分类性能的评价40
2.1.2 分类性能的可视化43
2.2 评分与排序46
2.2.1 排序性能的评价及可视化48
2.2.2 将排序器转化为分类器52
2.3 类概率估计54
2.3.1 类概率估计量55
2.3.2 将排序器转化为概率估计子57
2.4 小结与延伸阅读59
第3章 超越两类分类61
3.1 处理多类问题61
3.1.1 多类分类61
3.1.2 多类得分及概率65
3.2 回归68
3.3 无监督学习及描述性学习70
3.3.1 预测性聚类与描述性聚类71
3.2.2 其他描述性模型74
3.4 小结与延伸阅读76
第4章 概念学习77
4.1 假设空间78
4.1.1 最小一般性79
4.1.2 内部析取82
4.2 通过假设空间的路径84
4.2.1 最一般相容假设86
4.2.2 封闭概念87
4.3 超越合取概念88
4.4 可学习性92
4.5 小结与延伸阅读94
第5章 树模型97
5.1 决策树100
5.2 排序与概率估计树103
5.3 作为减小方差的树学习方法110
5.3.1 回归树110
5.3.2 聚类树113
5.4 小结与延伸阅读115
第6章 规则模型117
6.1 学习有序规则列表117
6.2 学习无序规则集124
6.2.1 用于排序和概率估计的规则集128
6.2.2 深入探究规则重叠130
6.3 描述性规则学习131
6.3.1 用于子群发现的规则学习131
6.3.2 关联规则挖掘135
6.4 一阶规则学习139
6.5 小结与延伸阅读143
第7章 线性模型145
7.1 最小二乘法146
7.1.1 多元线性回归150
7.1.2 正则化回归153
7.1.3 利用最小二乘回归实现分类153
7.2 感知机155
7.3 支持向量机158
7.4 从线性分类器导出概率164
7.5 超越线性的核方法168
7.6 小结与延伸阅读170
第8章 基于距离的模型173
8.1 距离测度的多样性173
8.2 近邻与范例178
8.3 最近邻分类器182
8.4 基于距离的聚类184
8.4.1 K均值算法186
8.4.2 K中心点聚类187
8.4.3 silhouette188
8.5 层次聚类190
8.6 从核函数到距离194
8.7 小结与延伸阅读195
第9章 概率模型197
9.1 正态分布及其几何意义200
9.2 属性数据的概率模型205
9.2.1 利用朴素贝叶斯模型实现分类206
9.2.2 训练朴素贝叶斯模型209
9.3 通过优化条件似然实现鉴别式学习211
9.4 含隐变量的概率模型214
9.4.1 期望最大化算法215
9.4.2 高斯混合模型216
9.5 基于压缩的模型218
9.6 小结与延伸阅读220
第10章 特征223
10.1 特征的类型223
10.1.1 特征上的计算223
10.1.2 属性特征、有序特征及数量特征227
10.1.3 结构化特征228
10.2 特征变换229
10.2.1 阈值化与离散化229
10.2.2 归一化与标定234
10.2.3 特征缺失239
10.3 特征的构造与选择240
10.4 小结与延伸阅读243
第11章 模型的集成245
11.1 Bagging与随机森林246
11.2 Boosting247
11.3 集成学习进阶250
11.3.1 偏差、方差及裕量250
11.3.2 其他集成方法251
11.3.3 元学习252
11.4 小结与延伸阅读252
第12章 机器学习的实验255
12.1 度量指标的选择256
12.2 量指标的获取258
12.3 如何解释度量指标260
12.4 小结与延伸阅读264
后记 路在何方267
记忆要点269
参考文献271
电子商务设计师教程 本书特色 根据人力资源和社会保障部、工业和信息化部文件,计算机技术与软件专业技术资格(水平)考试纳入全国专业技术人员职业资格证书制度的统一规...
精彩纷呈的科学家传记视角独特的科学史研究【编辑推荐】全面地对科学家的精神气质和杰出科学成就进行研究,并将其深入浅出地表述
本书介绍如何采用最合理的方式为RIA编写可靠的、易于维护的HTML、CSS和JavaScript代码,以及如何使用Ajax技术在后台实现浏览器与
HTML是网页制作的基础语言,是每个网页制作者必须掌握的内容。XHTML1.0是一种在HTML4.0基础上优化和改进的新语言,是基于XML的应
《打开:周濂的100堂西方哲学课》内容简介:★100篇有趣、有料,不高冷、不轻佻的哲学普及文章;一部有营养、有态度,读得懂、读得
Likeanyothersoftwaresystem,Websitesgraduallyaccumulate"cruft"overtime.Theyslowdo...
《物含妙理总堪寻 (理解科学丛书)》内容简介:本书来源于作者长期以来在北京师范大学开设的一个科普讲座“从爱因斯坦到霍金的宇宙
中文版CoreIDRAW图形设计经典技法118例-含光盘1张 本书特色 《中文版CorelDRAW图形设计经典技法118例(附光盘)》(作者曾全、邱雅莉)主要面...
《左宗棠(中华先贤人物故事汇)》内容简介:左宗棠(1812—1885),字季高,一字朴存,号湘上农人,湖南湘阴人。他一生参与镇压太
《我在精神病院抗抑郁》内容简介:这本书是重度抑郁症患者左灯对自己经历过的抗抑郁过程的全程直播。2017年9月下旬,由于某些原因的
服装CAD 本书特色 《服装CAD(附光盘)》由董伟英主编,本教材有以下特点:1.教材内容的设置新颖、实用、符合现代教学思想突出以应用为核心,紧密联系企业生产实...
Photoshop 图像处理高手秘笈138招-(附赠多媒体光盘1张) 本书特色 九天视觉主编的这本《Photoshop图像处理高手秘笈138招》根据多位资深平面...
《与大师同行》内容简介:经济思想的产生和发展,经历了一段漫长的历史。对于初学者来讲,穿越时间隧道的历程,充满着诸多的不确定
《油画棒宝典:路正先油画棒手绘完全自学教程》内容简介:本书是油画棒绘画的零基础完全自学教程,全书共分4章。第1章是油画棒绘画
《典型半导体团簇及组装材料的结构和电子特性》内容简介:典型半导体团簇及其团簇组装材料的结构及其电子性质的研究是当前团簇科学
《Linux内核观测技术BPF》内容简介:本书是一本面向系统工程师的实践指南,皆在帮助他们获得Linux内核中BPF虚拟机的专业知识。通过
所有程序员都知道应该做单元测试,但为什么你们没有做呢?是因为对单元测试不够了解,还是嫌单元测试麻烦,抑或认为单元测试的投
SarahAllen目前领导着BlazingCloud,这是一家位于旧金山的咨询公司,主要开发高级的移动和Web应用程序。她也是Mightyverse的共同
地理空间元数据关联网络构建与应用 本书特色 在介绍相关研究背景与意义、国内外研究现状、相关理论方法的基础上,本书阐述面向关联数据的地理空间数据语义关联网络构建方...
《Altium Designer 18电路设计从入门到精通(第2版)》内容简介:全书以Altium Designer 18版本为平台,介绍了电路设计的方法和技巧