本书是最全面的机器学习教材之一。书中首先介绍了机器学习的构成要素(任务、模型、特征)和机器学习任务,接着详细分析了逻辑模型(树模型、规则模型)、几何模型(线性模型和基于距离的模型)和概率模型,然后讨论了特征、模型的集成,以及被机器学习研究者称为“实验”的方法。作者不仅使用了已有术语,还引入了一些新的概念,同时提供了大量精选的示例和插图解说。
绪论 机器学习概述1
第1章 机器学习的构成要素9
1.1 任务:可通过机器学习解决的问题9
1.1.1 探寻结构11
1.1.2 性能评价13
1.2 模型:机器学习的输出14
1.2.1 几何模型14
1.2.2 概率模型17
1.2.3 逻辑模型22
1.2.4 分组模型与评分模型26
1.3 特征:机器学习的马达26
1.3.1 特征的两种用法28
1.3.2 特征的构造与变换29
1.3.3 特征之间的交互32
1.4 总结与展望33
第2章 两类分类及相关任务37
2.1 分类39
2.1.1 分类性能的评价40
2.1.2 分类性能的可视化43
2.2 评分与排序46
2.2.1 排序性能的评价及可视化48
2.2.2 将排序器转化为分类器52
2.3 类概率估计54
2.3.1 类概率估计量55
2.3.2 将排序器转化为概率估计子57
2.4 小结与延伸阅读59
第3章 超越两类分类61
3.1 处理多类问题61
3.1.1 多类分类61
3.1.2 多类得分及概率65
3.2 回归68
3.3 无监督学习及描述性学习70
3.3.1 预测性聚类与描述性聚类71
3.2.2 其他描述性模型74
3.4 小结与延伸阅读76
第4章 概念学习77
4.1 假设空间78
4.1.1 最小一般性79
4.1.2 内部析取82
4.2 通过假设空间的路径84
4.2.1 最一般相容假设86
4.2.2 封闭概念87
4.3 超越合取概念88
4.4 可学习性92
4.5 小结与延伸阅读94
第5章 树模型97
5.1 决策树100
5.2 排序与概率估计树103
5.3 作为减小方差的树学习方法110
5.3.1 回归树110
5.3.2 聚类树113
5.4 小结与延伸阅读115
第6章 规则模型117
6.1 学习有序规则列表117
6.2 学习无序规则集124
6.2.1 用于排序和概率估计的规则集128
6.2.2 深入探究规则重叠130
6.3 描述性规则学习131
6.3.1 用于子群发现的规则学习131
6.3.2 关联规则挖掘135
6.4 一阶规则学习139
6.5 小结与延伸阅读143
第7章 线性模型145
7.1 最小二乘法146
7.1.1 多元线性回归150
7.1.2 正则化回归153
7.1.3 利用最小二乘回归实现分类153
7.2 感知机155
7.3 支持向量机158
7.4 从线性分类器导出概率164
7.5 超越线性的核方法168
7.6 小结与延伸阅读170
第8章 基于距离的模型173
8.1 距离测度的多样性173
8.2 近邻与范例178
8.3 最近邻分类器182
8.4 基于距离的聚类184
8.4.1 K均值算法186
8.4.2 K中心点聚类187
8.4.3 silhouette188
8.5 层次聚类190
8.6 从核函数到距离194
8.7 小结与延伸阅读195
第9章 概率模型197
9.1 正态分布及其几何意义200
9.2 属性数据的概率模型205
9.2.1 利用朴素贝叶斯模型实现分类206
9.2.2 训练朴素贝叶斯模型209
9.3 通过优化条件似然实现鉴别式学习211
9.4 含隐变量的概率模型214
9.4.1 期望最大化算法215
9.4.2 高斯混合模型216
9.5 基于压缩的模型218
9.6 小结与延伸阅读220
第10章 特征223
10.1 特征的类型223
10.1.1 特征上的计算223
10.1.2 属性特征、有序特征及数量特征227
10.1.3 结构化特征228
10.2 特征变换229
10.2.1 阈值化与离散化229
10.2.2 归一化与标定234
10.2.3 特征缺失239
10.3 特征的构造与选择240
10.4 小结与延伸阅读243
第11章 模型的集成245
11.1 Bagging与随机森林246
11.2 Boosting247
11.3 集成学习进阶250
11.3.1 偏差、方差及裕量250
11.3.2 其他集成方法251
11.3.3 元学习252
11.4 小结与延伸阅读252
第12章 机器学习的实验255
12.1 度量指标的选择256
12.2 量指标的获取258
12.3 如何解释度量指标260
12.4 小结与延伸阅读264
后记 路在何方267
记忆要点269
参考文献271
《2015年考研政治高分练习题库》内容简介:本书由权威专家全新编写—— 全:全面覆盖大纲知识点。专:专门针对单项选择题与多项选择
《手到病自除4:儿童常见病特效疗法(2022版)》内容简介:本书既是一本故事书,又是一本说明书;本书用全彩真人实拍图来示范40余种
《Java编程艺术》共分5个部分。第1部分为新手上路篇,介绍Java编程基础和环境。第2部分为深入篇,将带领你走进Java面向对象编程大
和声搜索算法及其在几类控制问题中的应用研究 内容简介 本书分六章, 内容包括: 第1章: 介绍了*优化问题及其发展情况、和声搜索算法的研究现状和几类控制问题。第...
达尔文的黑匣子:生化理论对进化论的挑战,ISBN:9787801092663,作者:(美)迈克尔·J.贝希[M.J.Behe]著;邢锡范[等]译作者简介
《JAVAWEB整合开发实例精通:Struts+Hibernate+Spring(1碟)》介绍如何整合Struts+Hibemate+Spring进行JavaW...
冯登国(FENGDengguo,1965.5~),现为中国科学院软件所研究员、博士生导师,信息安全国家重点实验室主任,国家计算机网络入侵防范中
《时装设计元素:调研与设计》是与设计相关的重要元素。《时装设计元素:调研与设计》通过一系列的章节,讲解了一个设计师首先可能
《许倬云说美国:一个不断变化的现代西方文明》内容简介:客居美国六十余载,华人史学大家许倬云分享自己的亲身经历,以历史学、社
《美的找寻者:汝信传》内容简介:汝信为江苏吴江人,他14岁走进大学校门,17岁加入中共地下党,18岁参加人民解放军,在朝鲜战场的
《JavaScript征途》是一本学习JavaScript语言的权威书籍,在遵循语言学习的特殊规律基础上精心选材,力争做到统筹、有序,在结构
ThisbookwillshowJavadevelopershowtousetheGoogleWebToolkit(GWT)torapidlycreateric...
《宝贝,宝贝(2021版)》内容简介:我相信,每个孩子都是一个独特的灵魂,都有属于自己的路…… 一个普通的父亲,爱他的一个普通的
《自由职业设计师工作手册》对那些希望成为一个长期而成功的自由设计师来说,是一本实用性很强并附有插图的案头参考工具书。内容
《建筑是什么》内容简介:《建筑是什么:关于当今中国建筑的思考》对近年建筑及房地产业的业内热点问题进行评论,反思当今中国建筑
该合订本内容包括:合订增值版人物&报道:包括《程序员》的经典品牌栏目名人堂、软件产业、人物专访、软件创业及程序百味等,您即
《细菌为什么看不见》内容简介:细菌是地球上最古老的生物,是大自然物质循环的主要参与者。它们无法用肉眼观察到,却无时无刻不在
《春水集》内容简介:《春水集》是作者从事博物馆工作以来的学术散文集,主要内容为清代、民国以来学林掌故以及著名学人的生平、往
《二十五史藝文經籍志考補萃編續刊(第十二卷)》内容简介:本书是一部史志目录汇集与整理的大型丛书,对所收之书,每种都精选底本
本书系统、深入地介绍了通信系统及通信网的基本原理及基本分析方法,是通信及信息专业的专业基础课教材。全书共二十一章,内容包