深度实践Spark机器学习

深度实践Spark机器学习

作者:吴茂贵 等

出版社:机械工业

出版年:2018年1月

ISBN:9787111589952

所属分类:历史文化

书刊介绍

《深度实践Spark机器学习》内容简介

大数据、人工智能正在改变或颠覆各行各业,包括我们的生活。大数据、人工智能方面的人才已经供不应求,但作为人工智能的核心——机器学习,因涉及的知识和技能比较多,除了需要具备一定的数学基础、相关业务知识外,还要求有比较全面的技术储备,如操作系统、数据库、开发语言、数据分析工具、大数据计算平台等,无形中提高了机器学习的门槛。如何降低机器学习的门槛,让更多有志于机器学习、人工智能的人能更方便或顺畅地使用、驾驭机器学习? 希望你通过阅读本书,不但可以了解很多内容或代码,更可以亲自运行或调试这些代码,从而带来新的体验和收获!

作品目录

前言
第1章:了解机器学习
1.1、机器学习的定义
1.2、大数据与机器学习
1.3、机器学习、人工智能及深度学习
1.4、机器学习的基本任务
1.5、如何选择合适算法
1.6、Spark在机器学习方面的优势
1.7、小结
第2章:构建Spark机器学习系统
2.1、机器学习系统架构
2.2、启动集群
2.3、加载数据
2.4、探索数据
2.5、数据预处理
2.6、构建模型
2.7、模型评估
2.8、组装
2.9、模型选择或调优
2.10、保存模型
2.11、小结
第3章:ML
Pipeline原理与实战
3.1、Pipeline简介
3.2、DataFrame
3.3、Pipeline组件
3.4、Pipeline原理
3.5、Pipeline实例
3.6、小结
第4章:特征提取、转换和选择
4.1、特征提取
4.2、特征转换
4.3、特征选择
4.4、小结
第5章:模型选择和优化
5.1、模型选择
5.2、交叉验证
5.3、训练验证拆分法
5.4、自定义模型选择
5.5、小结
第6章:Spark
MLlib基础
6.1、Spark
MLlib简介
6.2、Spark
MLlib架构
6.3、数据类型
6.4、基础统计
6.5、RDD、Dataframe和Dataset
6.6、小结
第7章:构建Spark
ML推荐模型
7.1、推荐模型简介
7.2、数据加载
7.3、数据探索
7.4、训练模型
7.5、组装
7.6、评估模型
7.7、模型优化
7.8、小结
第8章:构建Spark
ML分类模型
8.1、分类模型简介
8.2、数据加载
8.3、数据探索
8.4、数据预处理
8.5、组装
8.6、模型优化
8.7、小结
第9章:构建Spark
ML回归模型
9.1、回归模型简介
9.2、数据加载
9.3、探索特征分布
9.4、数据预处理
9.5、组装
9.6、模型优化
9.7、小结
第10章:构建Spark
ML聚类模型
10.1、K-means模型简介
10.2、数据加载
10.3、探索特征的相关性
10.4、数据预处理
10.5、组装
10.6、模型优化
10.7、小结
第11章:PySpark决策树模型
11.1、PySpark简介
11.2、决策树简介
11.3、数据加载
11.4、数据探索
11.5、数据预处理
11.6、创建决策树模型
11.7、训练模型进行预测
11.8、模型优化
11.9、脚本方式运行
11.10、小结
第12章:SparkR朴素贝叶斯模型
12.1、SparkR简介
12.2、获取数据
12.3、朴素贝叶斯分类器
12.4、小结
第13章:使用Spark
Streaming构建在线学习模型
13.1、Spark
Streaming简介
13.2、Dstream操作
13.3、Spark
Streaming应用实例
13.4、Spark
Streaming在线学习实例
13.5、小结
第14章:TensorFlowOnSpark详解
14.1、TensorFlow简介
14.2、TensorFlow实现卷积神经网络
14.3、TensorFlow实现循环神经网络
14.4、分布式TensorFlow
14.5、TensorFlowOnSpark架构
14.6、TensorFlowOnSpark安装
14.7、TensorFlowOnSpark实例
14.8、小结
附录A
线性代数
附录B
概率统计
附录C
Scala基础

相关推荐

微信二维码