本书是最全面的机器学习教材之一。书中首先介绍了机器学习的构成要素(任务、模型、特征)和机器学习任务,接着详细分析了逻辑模型(树模型、规则模型)、几何模型(线性模型和基于距离的模型)和概率模型,然后讨论了特征、模型的集成,以及被机器学习研究者称为“实验”的方法。作者不仅使用了已有术语,还引入了一些新的概念,同时提供了大量精选的示例和插图解说。
绪论 机器学习概述1
第1章 机器学习的构成要素9
1.1 任务:可通过机器学习解决的问题9
1.1.1 探寻结构11
1.1.2 性能评价13
1.2 模型:机器学习的输出14
1.2.1 几何模型14
1.2.2 概率模型17
1.2.3 逻辑模型22
1.2.4 分组模型与评分模型26
1.3 特征:机器学习的马达26
1.3.1 特征的两种用法28
1.3.2 特征的构造与变换29
1.3.3 特征之间的交互32
1.4 总结与展望33
第2章 两类分类及相关任务37
2.1 分类39
2.1.1 分类性能的评价40
2.1.2 分类性能的可视化43
2.2 评分与排序46
2.2.1 排序性能的评价及可视化48
2.2.2 将排序器转化为分类器52
2.3 类概率估计54
2.3.1 类概率估计量55
2.3.2 将排序器转化为概率估计子57
2.4 小结与延伸阅读59
第3章 超越两类分类61
3.1 处理多类问题61
3.1.1 多类分类61
3.1.2 多类得分及概率65
3.2 回归68
3.3 无监督学习及描述性学习70
3.3.1 预测性聚类与描述性聚类71
3.2.2 其他描述性模型74
3.4 小结与延伸阅读76
第4章 概念学习77
4.1 假设空间78
4.1.1 最小一般性79
4.1.2 内部析取82
4.2 通过假设空间的路径84
4.2.1 最一般相容假设86
4.2.2 封闭概念87
4.3 超越合取概念88
4.4 可学习性92
4.5 小结与延伸阅读94
第5章 树模型97
5.1 决策树100
5.2 排序与概率估计树103
5.3 作为减小方差的树学习方法110
5.3.1 回归树110
5.3.2 聚类树113
5.4 小结与延伸阅读115
第6章 规则模型117
6.1 学习有序规则列表117
6.2 学习无序规则集124
6.2.1 用于排序和概率估计的规则集128
6.2.2 深入探究规则重叠130
6.3 描述性规则学习131
6.3.1 用于子群发现的规则学习131
6.3.2 关联规则挖掘135
6.4 一阶规则学习139
6.5 小结与延伸阅读143
第7章 线性模型145
7.1 最小二乘法146
7.1.1 多元线性回归150
7.1.2 正则化回归153
7.1.3 利用最小二乘回归实现分类153
7.2 感知机155
7.3 支持向量机158
7.4 从线性分类器导出概率164
7.5 超越线性的核方法168
7.6 小结与延伸阅读170
第8章 基于距离的模型173
8.1 距离测度的多样性173
8.2 近邻与范例178
8.3 最近邻分类器182
8.4 基于距离的聚类184
8.4.1 K均值算法186
8.4.2 K中心点聚类187
8.4.3 silhouette188
8.5 层次聚类190
8.6 从核函数到距离194
8.7 小结与延伸阅读195
第9章 概率模型197
9.1 正态分布及其几何意义200
9.2 属性数据的概率模型205
9.2.1 利用朴素贝叶斯模型实现分类206
9.2.2 训练朴素贝叶斯模型209
9.3 通过优化条件似然实现鉴别式学习211
9.4 含隐变量的概率模型214
9.4.1 期望最大化算法215
9.4.2 高斯混合模型216
9.5 基于压缩的模型218
9.6 小结与延伸阅读220
第10章 特征223
10.1 特征的类型223
10.1.1 特征上的计算223
10.1.2 属性特征、有序特征及数量特征227
10.1.3 结构化特征228
10.2 特征变换229
10.2.1 阈值化与离散化229
10.2.2 归一化与标定234
10.2.3 特征缺失239
10.3 特征的构造与选择240
10.4 小结与延伸阅读243
第11章 模型的集成245
11.1 Bagging与随机森林246
11.2 Boosting247
11.3 集成学习进阶250
11.3.1 偏差、方差及裕量250
11.3.2 其他集成方法251
11.3.3 元学习252
11.4 小结与延伸阅读252
第12章 机器学习的实验255
12.1 度量指标的选择256
12.2 量指标的获取258
12.3 如何解释度量指标260
12.4 小结与延伸阅读264
后记 路在何方267
记忆要点269
参考文献271
《作文课:让创意改变作文》内容简介:读书是为了更好的生活做准备,作文是表达自己的最好方式。本书作者谭旭东老师曾在中小学校举
《东亚《诗经》学研究(精)》内容简介:本书为作者多年来有关《诗经》研究之部分成果,共收入十篇论文,内容涉及中、日、韩三地之
《水的秘密》内容简介:水是地球上最常见的物质之一,是包括人类在内所有生命生存的重要资源,也是生物体最重要的组成部分。水在生
Wevetakenthebestandmadeitevenbetter.Thethirdeditionofthebest-sellingPHPandMySQLW...
在这本新书《实现模式》里面,KentBeck将自己多年形成的编程习惯以及阅读既有代码的体验凝练成了编程中的价值观、原则和77种实现
《信息图表设计入门》是一本信息图表制作的实用入门书。信息视觉化是一种潮流,无论是商业宣传活动、专业设计领域还是制作供非专
本书是关于数字信号处理(DSP)原理、实现和应用的最新教程。全书在概述了数字信号的产生、定义和处理实例之后,详细讨论了差分方
《儿童歌曲器乐演奏启蒙——扬琴》内容简介:本书是一套适于乐器初学者使用的简易曲集,包含二胡、古筝、琵琶、扬琴、竹笛、钢琴、
《用微课学计算机应用基础(Windows 7+Office 2010)》内容简介:本书是职业院校计算机专业及其他专业的计算机基础教材,通过翔实的
MATLAB车辆工程应用实战 本书特色本书全面系统地讲解了matlab控制仿真在车辆工程中的应用。书中结合理论和求解对象,解决复杂的工程问题,为实际工程所用,并...
《企业重组的税会处理与筹划》内容简介:本书内容涵盖了企业重组的所有主要形式,包括债务重组、股权收购、资产收购、企业合并、企
要成功,更重要的是必須了解材料特性與其搭配的加工方式,最後才完成這個超暢銷文創商品。當你的創意被綁架,只能用手邊現有的材
《犹太商人大智慧》内容简介:财富之道;翻开这本书,你将真正踏上百万富翁的成功之旅;如果看完这本书,你还不会挣钱,那你将一生
批处理在提高WINDOWS管理效率中的神奇应用 本书特色 本书作者结合多年的理论与实践知识,针对于系统管理员和网络管理员精心策划了这本书。本书将dos命令与批处...
计算机组成原理(第二版)(附光盘) 内容简介 本书是普通高等教育“十一五”国家级规划教材。本书第1版被列为“ 面向21世纪课...
《软件无线电》主要内容有数字无线电,通信系统,数字无线电系统五要素,信号失真的建模,模拟调制和解调,带自动增益控制的抽样
计算机网络:自顶向下方法与Internet特色:第3版 内容简介 本书以Internet为特色,采用自顶向下的方法由应用层到物理层顺序讲述计算机网络的基本原理及...
本书是对发生在西欧的三次著名的艺术运动(工艺美术运动、新艺术运动和装饰运动)中的“工艺美术运动”的综合性、专业性介绍和具
《萝莉正太动漫人物角色设定技法:元气森林》内容简介:萝莉和正太是对可爱的女孩和男孩的别称,他们不同的造型非常惹人喜爱。在以
Itsallinthename:LearnYouaHaskellforGreatGood!isahilarious,illustratedguidetothis...