本书是最全面的机器学习教材之一。书中首先介绍了机器学习的构成要素(任务、模型、特征)和机器学习任务,接着详细分析了逻辑模型(树模型、规则模型)、几何模型(线性模型和基于距离的模型)和概率模型,然后讨论了特征、模型的集成,以及被机器学习研究者称为“实验”的方法。作者不仅使用了已有术语,还引入了一些新的概念,同时提供了大量精选的示例和插图解说。
绪论 机器学习概述1
第1章 机器学习的构成要素9
1.1 任务:可通过机器学习解决的问题9
1.1.1 探寻结构11
1.1.2 性能评价13
1.2 模型:机器学习的输出14
1.2.1 几何模型14
1.2.2 概率模型17
1.2.3 逻辑模型22
1.2.4 分组模型与评分模型26
1.3 特征:机器学习的马达26
1.3.1 特征的两种用法28
1.3.2 特征的构造与变换29
1.3.3 特征之间的交互32
1.4 总结与展望33
第2章 两类分类及相关任务37
2.1 分类39
2.1.1 分类性能的评价40
2.1.2 分类性能的可视化43
2.2 评分与排序46
2.2.1 排序性能的评价及可视化48
2.2.2 将排序器转化为分类器52
2.3 类概率估计54
2.3.1 类概率估计量55
2.3.2 将排序器转化为概率估计子57
2.4 小结与延伸阅读59
第3章 超越两类分类61
3.1 处理多类问题61
3.1.1 多类分类61
3.1.2 多类得分及概率65
3.2 回归68
3.3 无监督学习及描述性学习70
3.3.1 预测性聚类与描述性聚类71
3.2.2 其他描述性模型74
3.4 小结与延伸阅读76
第4章 概念学习77
4.1 假设空间78
4.1.1 最小一般性79
4.1.2 内部析取82
4.2 通过假设空间的路径84
4.2.1 最一般相容假设86
4.2.2 封闭概念87
4.3 超越合取概念88
4.4 可学习性92
4.5 小结与延伸阅读94
第5章 树模型97
5.1 决策树100
5.2 排序与概率估计树103
5.3 作为减小方差的树学习方法110
5.3.1 回归树110
5.3.2 聚类树113
5.4 小结与延伸阅读115
第6章 规则模型117
6.1 学习有序规则列表117
6.2 学习无序规则集124
6.2.1 用于排序和概率估计的规则集128
6.2.2 深入探究规则重叠130
6.3 描述性规则学习131
6.3.1 用于子群发现的规则学习131
6.3.2 关联规则挖掘135
6.4 一阶规则学习139
6.5 小结与延伸阅读143
第7章 线性模型145
7.1 最小二乘法146
7.1.1 多元线性回归150
7.1.2 正则化回归153
7.1.3 利用最小二乘回归实现分类153
7.2 感知机155
7.3 支持向量机158
7.4 从线性分类器导出概率164
7.5 超越线性的核方法168
7.6 小结与延伸阅读170
第8章 基于距离的模型173
8.1 距离测度的多样性173
8.2 近邻与范例178
8.3 最近邻分类器182
8.4 基于距离的聚类184
8.4.1 K均值算法186
8.4.2 K中心点聚类187
8.4.3 silhouette188
8.5 层次聚类190
8.6 从核函数到距离194
8.7 小结与延伸阅读195
第9章 概率模型197
9.1 正态分布及其几何意义200
9.2 属性数据的概率模型205
9.2.1 利用朴素贝叶斯模型实现分类206
9.2.2 训练朴素贝叶斯模型209
9.3 通过优化条件似然实现鉴别式学习211
9.4 含隐变量的概率模型214
9.4.1 期望最大化算法215
9.4.2 高斯混合模型216
9.5 基于压缩的模型218
9.6 小结与延伸阅读220
第10章 特征223
10.1 特征的类型223
10.1.1 特征上的计算223
10.1.2 属性特征、有序特征及数量特征227
10.1.3 结构化特征228
10.2 特征变换229
10.2.1 阈值化与离散化229
10.2.2 归一化与标定234
10.2.3 特征缺失239
10.3 特征的构造与选择240
10.4 小结与延伸阅读243
第11章 模型的集成245
11.1 Bagging与随机森林246
11.2 Boosting247
11.3 集成学习进阶250
11.3.1 偏差、方差及裕量250
11.3.2 其他集成方法251
11.3.3 元学习252
11.4 小结与延伸阅读252
第12章 机器学习的实验255
12.1 度量指标的选择256
12.2 量指标的获取258
12.3 如何解释度量指标260
12.4 小结与延伸阅读264
后记 路在何方267
记忆要点269
参考文献271
EDIUS 6.5快刀手高效剪辑技法 本书特色 edius是一款用于广播电视和影视后期制作的视频剪辑软件,它支持当前所有标清和高清格式的实时编辑,被誉为pc平台...
Go并发编程实战-第2版 本书特色 本书首先介绍了Go语言的优势特性、安装设置方法、工程结构、标准命令和工具、语法基础、数据类型以及流程控制方法,接着阐述了与多...
ManyseriousJavaprogrammers,especiallyenterpriseJavaprogrammers,considerthenewI/O...
本书是一本CSS技术专著。主要从布局角度全面、系统和深入地讲解CSS在标准网站布局之中的应用。很多读者经过初步的学习之后就能够
《Essential C++中文版》内容简介:本书以四个面向来表现C++的本质:procedural(面向过程的)、generic(泛型的)、object-ba...
字体对于很多刚开始接触学习的人来说,是一条很难跨越的鸿沟,虽然国内外也有相关方面的书籍(以国外作品为主),但终究还是不适
《Kubernetes实战:构建生产级应用平台》内容简介:本书探讨了通往Kubernetes生产环境成功道路中所涉及的多种技术、模式和抽象方面
《这才是我想要的语文书:诗歌分册》内容简介:本分册分为时间与季节、风景与景色、亲爱的动物们、花树与果实、火车与旅行、梦想与
《世界3:海外中国艺术史研究》内容简介:20世纪后期以来,中国艺术史研究状况发生了显著的变化。那是西方新艺术史集中影响中国艺术
《中国对外贸易环境与贸易摩擦研究报告(2021)》内容简介:本报告的重要特点在于,从国别和区域视角考察中国对外贸易环境与贸易摩
《跟小贤学运营》内容简介:这是一部能帮助运营新人快速构建互联网运营方法论和快速掌握互联网运营实操的著作,是小贤在百度贴吧和
《首饰设计》系统地介绍了珠宝首饰设计,其侧重点在于开拓我们的创意性思维。作者以一个西方首饰专家独特的视角和对专业领域孜孜
Google Android2手机应用程序设计入门-第3版-(1DVD+手册) 本书特色 用*短的时间,跟随拥有android market单一应用程序下载超过...
《劫持》内容简介:《劫持》是一本探讨人与科技的关系的书,基于一位心理学博士20年的临床经验及其作为神经认知科学研究者的脑—电
《硅谷创业课》内容简介:本书包含了35位硅谷顶级投资人和创业导师关于创业和投资的智慧,包括彼得·蒂尔、史蒂夫·布兰克、埃里克
在线广告:互联网广告系统的架构及算法 本书特色 在线广告是一个多学科交融的领域,本书力求系统地讲解在线广告的架构和算法,让读者对在线广告有一个整体的认识。全书共...
在计算机发展的历史上,没有哪一种程序设计语言像C语言这样应用广泛。本书是C语言的设计者之一DennisM.Ritchie和著名计算机科学家
《千姿百态看德国·教育篇(汉德对照)》内容简介:这套《千姿百态看德国》丛书为了满足我国广大德语学习者学好德语和了解德国,进
kh10269名师讲坛Linux从入门到精通 内容简介 本书是中国台湾优秀it图书作家丰士昌先生的*新力作,总结了作者10余年来使用linux操作系统的经验和技...
《孩子咳嗽,自然疗法80种》内容简介:运用自然疗法,调动孩子身体的自愈能力,不仅治咳嗽更养生咳嗽并不是疾病,而是疾病的一种症