机器学习实践指南

机器学习实践指南

作者:麦好

出版社:机械工业

出版年:2014年4月

ISBN:9787111462071

所属分类:散文随笔

书刊介绍

《机器学习实践指南》内容简介

《机器学习实践指南:案例应用解析》是机器学习及数据分析领域不可多得的一本著作,也是为数不多的既有大量实践应用案例又包含算法理论剖析的著作,作者针对机器学习算法既抽象复杂又涉及多门数学学科的特点,力求理论联系实际,始终以算法应用为主线,由浅入深以全新的角度诠释机器学习。
全书分为准备篇、基础篇、统计分析实战篇和机器学习实战篇。准备篇介绍了机器学习的发展及应用前景以及常用科学计算平台,主要包括统计分析语言r、机器学习模块mlpy和neurolab、科学计算平台numpy、图像识别软件包opencv、网页分析beautifulsoup等软件的安装与配置。基础篇先对数学基础及其在机器学习领域的应用进行讲述,同时推荐配套学习的数学书籍,然后运用实例说明计算平台的使用,以python和r为实现语言,重点讲解了图像算法、信息隐藏、最小二乘法拟合、因子频率分析、欧氏距离等,告诉读者如何使用计算平台完成工程应用。最后,通过大量统计分析和机器学习案例提供实践指南,首先讲解回归分析、区间分布、数据图形化、分布趋势、正态分布、分布拟合等数据分析基础,然后讲解神经网络、统计算法、欧氏距离、余弦相似度、线性与非线性回归、数据拟合、线性滤波、图像识别、人脸辨识、网页分类等机器学习算法。此书可供算法工程师、it专业人员以及机器学习爱好者参考使用。
麦好,计算机专业工程硕士,目前从事智能计算与算法分析工作。先后就职于多家软件科技公司、电子科技公司,是中国青年海归协会和中国量化投资学会山西分会成员。实战经验丰富,擅长使用C、C++、Python、Perl、汇编等语言,参与过信息系统核心中间件的研发、海外社区插件及服务器脚本研发、垂直搜索引擎与文本分析系统的算法设计、通信系统的信息隐藏技术研发、视频服务与点播系统的研发、基于汇编的系统底层设计等,有十余年架构设计及算法设计经验,近期关注分布式计算、机器视觉、仿生智能、生物计算、商业智能。

作品目录

机器学习实践指南:案例应用解析
前言
第一部分
准备篇
第1章:机器学习发展及应用前景
1.1、机器学习概述
1.1.1、什么是机器学习
1.1.2、机器学习的发展
1.1.3、机器学习的未来
1.2、机器学习应用前景
1.2.1、数据分析与挖掘
1.2.2、模式识别
1.2.3、更广阔的领域
1.3、小结
第2章:科学计算平台
2.1、科学计算软件平台概述
2.1.1、常用的科学计算软件
2.1.2、本书使用的工程计算平台
2.2、计算平台的配置
2.2.1、Numpy等Python科学计算包的安装与配置
2.2.2、OpenCV安装与配置
2.2.3、mlpy安装与配置
2.2.4、BeautifulSoup安装与配置
2.2.5、Neurolab安装与配置
2.2.6、R安装与配置
2.3、小结
第二部分
基础篇
第3章:机器学习数学基础
3.1、数学对我们有用吗
3.2、机器学习需要哪些数学知识
3.3、小结
第4章:计算平台应用实例
4.1、Python计算平台简介及应用实例
4.1.1、Python语言基础
4.1.2、Numpy库
4.1.3、pylab、matplotlib绘图
4.1.4、图像基础
4.1.5、图像融合与图像镜像
4.1.6、图像灰度化与图像加噪
4.1.7、声音基础
4.1.8、声音音量调节
4.1.9、图像信息隐藏
4.1.10、声音信息隐藏
4.2、R语言基础
4.2.1、基本操作
4.2.2、向量
4.2.3、对象集属性
4.2.4、因子和有序因子
4.2.5、循环语句
4.2.6、条件语句
4.3、R语言科学计算
4.3.1、分类(组)统计
4.3.2、数组与矩阵基础
4.3.3、数组运算
4.3.4、矩阵运算
4.4、R语言计算实例
4.4.1、学生数据集读写
4.4.2、最小二乘法拟合
4.4.3、交叉因子频率分析
4.4.4、向量模长计算
4.4.5、欧氏距离计算
4.5、小结
思考题
第三部分
统计分析实战篇
第5章:统计分析基础
5.1、数据分析概述
5.2、数学基础
5.3、回归分析
5.3.1、单变量线性回归
5.3.2、多元线性回归
5.3.3、非线性回归
5.4、数据分析基础
5.4.1、区间频率分布
5.4.2、数据直方图
5.4.3、数据散点图
5.4.4、五分位数
5.4.5、累积分布函数
5.4.6、核密度估计
5.5、数据分布分析
5.6、小结
思考题
第6章:统计分析案例
6.1、数据图形化案例解析
6.1.1、点图
6.1.2、饼图和条形图
6.1.3、茎叶图和箱线图
6.2、数据分布趋势案例解析
6.2.1、平均值
6.2.2、加权平均值
6.2.3、数据排序
6.2.4、中位数
6.2.5、极差、半极差
6.2.6、方差
6.2.7、标准差
6.2.8、变异系数、样本平方和
6.2.9、偏度系数、峰度系数
6.3、正态分布案例解析
6.3.1、正态分布函数
6.3.2、峰度系数分析
6.3.3、累积分布概率
6.3.4、概率密度函数
6.3.5、分位点
6.3.6、频率直方图
6.3.7、核概率密度与正态概率分布图
6.3.8、正太检验与分布拟合
6.3.9、其他分布及其拟合
6.4、小结
思考题
第四部分
机器学习实战篇
第7章:机器学习算法
7.1、神经网络
7.1.1、Rosenblatt感知器
7.1.2、梯度下降
7.1.3、反向传播与多层感知器
7.1.4、Python神经网络库
7.2、统计算法
7.2.1、平均值
7.2.2、方差与标准差
7.2.3、贝叶斯算法
7.3、欧氏距离
7.4、余弦相似度
7.5、SVM
7.5.1、数学原理
7.5.2、SMO算法
7.5.3、算法应用
7.6、回归算法
7.6.1、线性代数基础
7.6.2、最小二乘法原理
7.6.3、线性回归
7.6.4、多元非线性回归
7.6.5、岭回归方法
7.6.6、伪逆方法
7.7、PCA降维
7.8、小结
思考题
第8章:数据拟合案例
8.1、数据拟合
8.1.1、图像分析法
8.1.2、神经网络拟合法
8.2、线性滤波
8.2.1、WAV声音文件
8.2.2、线性滤波算法过程
8.2.3、滤波Python实现
8.3、小结
思考题
第9章:图像识别案例
9.1、图像边缘算法
9.1.1、数字图像基础
9.1.2、算法描述
9.2、图像匹配
9.2.1、差分矩阵求和
9.2.2、差分矩阵均值
9.2.3、欧氏距离匹配
9.3、图像分类
9.3.1、余弦相似度
9.3.2、PCA图像特征提取算法
9.3.3、基于神经网络的图像分类
9.3.4、基于SVM的图像分类
9.4、人脸辨识
9.4.1、人脸定位
9.4.2、人脸辨识
9.5、手写数字识别
9.5.1、手写数字识别算法
9.5.2、算法的Python实现
9.6、小结
思考题
第10章:文本分类案例
10.1、文本分类概述
10.2、余弦相似度分类
10.2.1、中文分词
10.2.2、停用词清理
10.2.3、算法实战
10.3、朴素贝叶斯分类
10.3.1、算法描述
10.3.2、先验概率计算
10.3.3、最大后验概率
10.3.4、算法实现
10.4、小结
思考题
彩图部分

相关推荐

微信二维码