Hadoop大数据挖掘从入门到进阶实战

Hadoop大数据挖掘从入门到进阶实战

作者:邓杰 编著

出版社:机械工业

出版年:2018年6月

ISBN:9787111600107

所属分类:文学理论

书刊介绍

《Hadoop大数据挖掘从入门到进阶实战》内容简介

本书采用“理论+实战”的形式编写,全面介绍了Hadoop大数据挖掘的相关知识。本书共分为13章,涵盖的主要内容有:集群及开发环境搭建;快速构建一个Hadoop项目并线上运行;Hadoop套件实战;Hive编程,使用SQL提交MapReduce任务到Hadoop集群;游戏玩家的用户行为分析,特征提取;Hadoop平台管理与维护;Hadoop异常处理解决方案;初识Hadoop核心源码;Hadoop通信机制和内部协议;Hadoop分布式文件系统剖析;ELK实战案例——游戏应用实时日志分析平台;Kafka实战案例,实时处理游戏用户数据;Hadoop拓展,Kafka剖析。本书不但适合刚入门的初学者系统学习Hadoop的各种基础语法和开发技巧,而且也适合有多年开发经验的开发者进阶提高。另外,本书也适合社会培训机构和相关院校作为教材或者教学参考书。
邓杰编著。

作品目录

前言
第1章:集群及开发环境搭建
1.1、环境准备
1.2、安装Hadoop
1.3、Hadoop版Hello
World
1.4、开发环境
1.5、小结
第2章:实战:快速构建一个Hadoop项目并线上运行
2.1、构建一个简单的项目工程
2.2、操作分布式文件系统(HDFS)
2.3、利用IDE提交MapReduce作业
2.4、编译应用程序并打包
2.5、部署与调度
2.6、小结
第3章:Hadoop套件实战
3.1、Sqoop——数据传输工具
3.2、Flume——日志收集工具
3.3、HBase——分布式数据库
3.4、Zeppelin——数据集分析工具
3.5、Drill——低延时SQL查询引擎
3.6、Spark——实时流数据计算
3.7、小结
第4章:Hive编程——使用SQL提交MapReduce任务到Hadoop集群
4.1、环境准备与Hive初识
4.2、安装与配置Hive
4.3、可编程方式
4.4、运维和监控
4.5、小结
第5章:游戏玩家的用户行为分析——特征提取
5.1、项目应用概述
5.2、分析与设计
5.3、技术选型
5.4、编码实践
5.5、小结
第6章:Hadoop平台管理与维护
6.1、Hadoop分布式文件系统(HDFS)
6.2、Hadoop平台监控
6.3、平台维护
6.4、小结
第7章:Hadoop异常处理解决方案
7.1、定位异常
7.2、解决问题的方式
7.3、实战案例分析
7.4、小结
第8章:初识Hadoop核心源码
8.1、基础准备与源码编译
8.2、初识Hadoop
2、8.3、MapReduce框架剖析
8.4、序列化
8.5、小结
第9章:Hadoop通信机制和内部协议
9.1、Hadoop
RPC概述
9.2、Hadoop
RPC的分析与使用
9.3、通信协议
9.4、小结
第10章:Hadoop分布式文件系统剖析
10.1、HDFS介绍
10.2、HDFS架构剖析
10.3、数据迁移实战
10.4、小结
第11章:ELK实战案例——游戏应用实时日志分析平台
11.1、Logstash——实时日志采集、分析和传输
11.2、Elasticsearch——分布式存储及搜索引擎
11.3、Kibana——可视化管理系统
11.4、实时日志分析平台案例
11.5、小结
第12章:Kafka实战案例——实时处理游戏用户数据
12.1、应用概述
12.2、项目的分析与设计
12.3、项目的编码实践
12.4、小结
第13章:Hadoop拓展——Kafka剖析
13.1、Kafka开发与维护
13.2、运维监控
13.3、Kafka源码分析
13.4、小结

相关推荐

微信二维码