Hadoop与大数据挖掘

Hadoop与大数据挖掘

作者:张良均

出版社:机械工业

出版年:2017年5月

ISBN:9787111567875

所属分类:经济金融

书刊介绍

《Hadoop与大数据挖掘》内容简介

本书共14章,分三个部分:基础篇、实战篇、高级篇。基础篇介绍了数据挖掘、Hadoop大数据的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得大数据项目挖掘分析经验,同时快速领悟看似难懂的大数据分析与挖掘理论知识。
读者在阅读过程中,应充分利用随书配套的案例建模数据,借助TipDM-HB大数据挖掘建模平台,通过上机实验,以快速理解相关知识与理论。

作品目录

前言
第一篇
基础篇
第1章:浅谈大数据
1.1、大数据概述
1.2、大数据平台
1.3、本章小结
第2章:大数据存储与运算利器—Hadoop
2.1、Hadoop概述
2.2、Hadoop配置及IDE配置
2.3、Hadoop集群命令
2.4、Hadoop编程开发
2.5、K-Means算法原理及Hadoop
MapReduce实现
2.6、TF-IDF算法原理及Hadoop
MapReduce实现
2.7、本章小结
第3章:大数据查询—Hive
3.1、Hive概述
3.2、HiveQL语句
3.3、动手实践:基于Hive的学生信息查询
3.4、基于Hive的航空公司客户价值数据预处理及分析
3.5、本章小结
第4章:大数据快速读写—HBase
4.1、HBase概述
4.2、配置HBase集群
4.3、HBase原理与架构组件
4.4、HBase
Shell操作
4.5、Java
API&MapReduce与HBase交互
4.6、基于HBase的冠字号查询系统
4.7、本章小结
第5章:大数据处理—Pig
5.1、Pig概述
5.2、配置运行Pig
5.3、常用Pig
Latin操作
5.4、综合实践
5.5、本章小结
第6章:大数据快速运算与挖掘—Spark
6.1、Spark概述
6.2、Spark安装集群
6.3、Spark架构与核心原理
6.4、Spark编程技巧
6.5、如何学习Spark
MLlib
6.6、动手实践:基于Spark
ALS电影推荐系统
6.7、本章小结
第7章:大数据工作流—Oozie
7.1、Oozie简介
7.2、编译配置并运行Oozie
7.3、Oozie
WorkFlow实践
7.4、Oozie
Coordinator实践
7.5、本章小结
第二篇
挖掘实战篇
第8章:法律服务大数据智能推荐
8.1、背景
8.2、目标
8.3、系统架构及流程
8.4、分析过程及实现
8.5、构建法律服务大数据智能推荐系统
8.6、本章小结

相关推荐

微信二维码