Spark机器学习进阶实战

Spark机器学习进阶实战

作者:马海平于俊吕昕向海

出版社:机械工业

出版年:2018年9月

ISBN:9787111608103

所属分类:经济金融

书刊介绍

《Spark机器学习进阶实战》内容简介

本书一共分三大部分:基础篇(1-2章)对Spark机器学习进行概述、并通过Spark机器学习开始进行数据分析;算法篇(3-8章)针对分类、聚类、回归、协同过滤、关联规则、降维等算法进行详细讲解,并进行案例支持;综合案例篇(9-12章)重点通过异常检测、用户画像、广告点击率预估、智慧交通大数据4个综合场景,详细讲解基于Spark机器学习的综合应用。
马海平,向海,吕昕,于俊著。

作品目录

前言
第一篇
基础篇
第1章:机器学习概述
1.1、机器学习概述
1.2、机器学习算法
1.3、机器学习分类
1.4、机器学习综合应用
1.5、本章小结
第2章:数据分析流程和方法
2.1、数据分析概述
2.2、数据分析流程
2.3、数据分析的基本方法
2.4、简单的数据分析实践
2.5、本章小结
第二篇
算法篇
第3章:构建分类模型
3.1、分类模型概述
3.2、分类模型算法
3.3、分类效果评估
3.4、App数据的分类实现
3.5、其他分类模型
3.6、本章小结
第4章:构建聚类模型
4.1、聚类概述
4.2、聚类模型
4.3、聚类效果评价
4.4、使用KMeans对鸢尾花卉数据集聚类
4.5、使用DBSCAN对GPS数据进行聚类
4.6、其他模型
4.7、本章小结
第5章:构建回归模型
5.1、常用回归模型
5.2、评估指标
5.3、回归模型优化
5.4、构建UCI裙子销售数据回归模型
5.5、其他回归模型案例
5.6、本章小结
第6章:构建关联规则模型
6.1、关联规则概述
6.2、常用关联规则算法
6.3、效果评估和优化
6.4、使用FP-Growth对豆瓣评分数据进行挖掘
6.5、其他应用场景
6.6、本章小结
第7章:协同过滤
7.1、协同过滤概述
7.2、常用的协同过滤算法
7.3、评估标准
7.4、使用电影评分数据进行协同过滤实践
7.5、本章小结
第8章:数据降维
8.1、降维概述
8.2、常用降维算法
8.3、降维评估标准
8.4、使用PCA对Digits数据集进行降维
8.5、其他降维方法
8.6、本章小结
第三篇
综合应用篇
第9章:异常检测
9.1、异常概述
9.2、异常检测方法
9.3、异常检测系统
9.4、应用场景
9.5、新闻App数据异常检测实践
9.6、本章小结
第10章:用户画像
10.1、用户画像概述
10.2、用户画像流程
10.3、构建用户画像
10.4、用户画像评估和使用
10.5、新闻App用户画像实践
10.6、本章小结
第11章:广告点击率预估
11.1、点击率预估概述
11.2、点击率预估技术
11.3、模型效果评估
11.4、新闻App点击率预估实践
11.5、本章小结
第12章:企业征信大数据应用
12.1、征信概述
12.2、企业征信大数据平台
12.3、企业征信大数据应用
12.4、企业法人资产建模实践
12.5、本章小结
第13章:智慧交通大数据应用
13.1、智慧交通大数据概述
13.2、人群生活模式划分
13.3、道路拥堵模式聚类
13.4、本章小结

相关推荐

微信二维码