本书是最全面的机器学习教材之一。书中首先介绍了机器学习的构成要素(任务、模型、特征)和机器学习任务,接着详细分析了逻辑模型(树模型、规则模型)、几何模型(线性模型和基于距离的模型)和概率模型,然后讨论了特征、模型的集成,以及被机器学习研究者称为“实验”的方法。作者不仅使用了已有术语,还引入了一些新的概念,同时提供了大量精选的示例和插图解说。
绪论 机器学习概述1
第1章 机器学习的构成要素9
1.1 任务:可通过机器学习解决的问题9
1.1.1 探寻结构11
1.1.2 性能评价13
1.2 模型:机器学习的输出14
1.2.1 几何模型14
1.2.2 概率模型17
1.2.3 逻辑模型22
1.2.4 分组模型与评分模型26
1.3 特征:机器学习的马达26
1.3.1 特征的两种用法28
1.3.2 特征的构造与变换29
1.3.3 特征之间的交互32
1.4 总结与展望33
第2章 两类分类及相关任务37
2.1 分类39
2.1.1 分类性能的评价40
2.1.2 分类性能的可视化43
2.2 评分与排序46
2.2.1 排序性能的评价及可视化48
2.2.2 将排序器转化为分类器52
2.3 类概率估计54
2.3.1 类概率估计量55
2.3.2 将排序器转化为概率估计子57
2.4 小结与延伸阅读59
第3章 超越两类分类61
3.1 处理多类问题61
3.1.1 多类分类61
3.1.2 多类得分及概率65
3.2 回归68
3.3 无监督学习及描述性学习70
3.3.1 预测性聚类与描述性聚类71
3.2.2 其他描述性模型74
3.4 小结与延伸阅读76
第4章 概念学习77
4.1 假设空间78
4.1.1 最小一般性79
4.1.2 内部析取82
4.2 通过假设空间的路径84
4.2.1 最一般相容假设86
4.2.2 封闭概念87
4.3 超越合取概念88
4.4 可学习性92
4.5 小结与延伸阅读94
第5章 树模型97
5.1 决策树100
5.2 排序与概率估计树103
5.3 作为减小方差的树学习方法110
5.3.1 回归树110
5.3.2 聚类树113
5.4 小结与延伸阅读115
第6章 规则模型117
6.1 学习有序规则列表117
6.2 学习无序规则集124
6.2.1 用于排序和概率估计的规则集128
6.2.2 深入探究规则重叠130
6.3 描述性规则学习131
6.3.1 用于子群发现的规则学习131
6.3.2 关联规则挖掘135
6.4 一阶规则学习139
6.5 小结与延伸阅读143
第7章 线性模型145
7.1 最小二乘法146
7.1.1 多元线性回归150
7.1.2 正则化回归153
7.1.3 利用最小二乘回归实现分类153
7.2 感知机155
7.3 支持向量机158
7.4 从线性分类器导出概率164
7.5 超越线性的核方法168
7.6 小结与延伸阅读170
第8章 基于距离的模型173
8.1 距离测度的多样性173
8.2 近邻与范例178
8.3 最近邻分类器182
8.4 基于距离的聚类184
8.4.1 K均值算法186
8.4.2 K中心点聚类187
8.4.3 silhouette188
8.5 层次聚类190
8.6 从核函数到距离194
8.7 小结与延伸阅读195
第9章 概率模型197
9.1 正态分布及其几何意义200
9.2 属性数据的概率模型205
9.2.1 利用朴素贝叶斯模型实现分类206
9.2.2 训练朴素贝叶斯模型209
9.3 通过优化条件似然实现鉴别式学习211
9.4 含隐变量的概率模型214
9.4.1 期望最大化算法215
9.4.2 高斯混合模型216
9.5 基于压缩的模型218
9.6 小结与延伸阅读220
第10章 特征223
10.1 特征的类型223
10.1.1 特征上的计算223
10.1.2 属性特征、有序特征及数量特征227
10.1.3 结构化特征228
10.2 特征变换229
10.2.1 阈值化与离散化229
10.2.2 归一化与标定234
10.2.3 特征缺失239
10.3 特征的构造与选择240
10.4 小结与延伸阅读243
第11章 模型的集成245
11.1 Bagging与随机森林246
11.2 Boosting247
11.3 集成学习进阶250
11.3.1 偏差、方差及裕量250
11.3.2 其他集成方法251
11.3.3 元学习252
11.4 小结与延伸阅读252
第12章 机器学习的实验255
12.1 度量指标的选择256
12.2 量指标的获取258
12.3 如何解释度量指标260
12.4 小结与延伸阅读264
后记 路在何方267
记忆要点269
参考文献271
《Servlet与JSP核心编程》(第2版)叙述详尽,条理清晰。对于初学者来说是一本不可多得的入门书籍,经验丰富的Servelet和JSP开发人
《3D少儿游戏编程(原书第2版)》内容简介:你知道什么比玩游戏更有趣吗?自己编程!制作自己的在线游戏,即使你完全是一个初学者,
本书以Xinu(一个小型简洁的操作系统)为例,全面介绍操作系统设计方面的知识。本书着重讨论用于嵌入式设备的微内核操作系统,采
《AI游戏引擎程序设计》为游戏开发人员创建现代游戏的AI引擎提供了工具和必要的指导。带领读者从理论入实际的游戏开发,并给出可
当“设计”和“创意”成为时尚的时候,终于有人出来提醒“被设计”的“原罪”。从辨析Design中译的含义到回应霍金《大设计》的思
《纳兰词集》内容简介:清代词坛中兴,名家辈出,其中以纳兰性德最引人注目,国学大师王国维赞其“北宋以来,一人而已”。纳兰词以
《MATLAB神经网络应用设计》利用目前国际上流行的MATLAB环境,结合神经网络工具箱,在深入浅出地介绍人工神经网络中的各种典型网
微机原理与接口技术 内容简介 本书是省精品课程教材,依据电子信息科学与电气信息类平台课程教学基本要求编写,以80x86为主,介绍微机原理的基本理论与技术应用。主...
AndyOramAndyOram是OReillyMedia的编辑。他从1992年开始就在这家公司工作,Andy目前主要关注自由软件和开源技术。他在OReilly...
Acompleteandthoroughandup-to-datereferenceguideforCSS.StopwastingtimedoingIntern...
《免疫力是最好的医生》内容简介:为什么常年慢性病等基础性疾病人群容易感染疫病等各种疾病,因为免疫力差。好好调理呼吸道疾病、
《精通搜索分析》是一本关于搜索分析的综合性著作,致力于分析和优化站内搜索、移动设备和社会化媒体。本书将营销实践和搜索引擎
本书由浅入深、通俗易懂地讲解了网页制作和动态网站建设的知识与实战项目。全书共24章,从网站建设的基本概念开始,讲解了网站设
社会经济的发展,使得移动通信技术日新月异。本书系统、全面地介绍了移动通信的相关概念、关键技术以及一些典型的移动通信系统,
《故乡情·北江谣》内容简介:《故乡情·北江谣》一书的内容分为上下两篇,作者林永泽有着深厚的文字功底,擅长运用四时之景的变化
《不可消失的门店》内容简介:第一部全面深度阐释新零售时代电商与实体门店如何可持续发展的著作。贝尔教授通过对Bonobos.com、 Di
复杂网络上的博弈 本书特色谢逢洁编写的《复杂网络上的博弈》从博弈论和复杂网络的基本概念及基础理论出发,介绍相关研究领域,重点讲解博弈论和复杂网络的交叉领域的基本...
《人脸识别与美颜算法实战》内容简介:本书从实战出发,介绍了大约60多个案例,脉络清晰,没有太多枯燥的理论讲解,而是以一位资深
Theworlds#1bookonnetworkandInternetsecurityhasbeenthoroughlyupdatedtoreflecttoda...
李蕙蓁│研究所專研生態與觀光遊憩,喜愛藝術、設計、攝影,曾在望安與海龜結下不解之緣,擁有豐富的「龜」收藏。曾任報紙、雜誌