Hadoop大数据分析技术

Hadoop大数据分析技术

作者:迟殿委陈鹏程

出版社:清华大学

出版年:2022年11月

ISBN:9787302620990

所属分类:教辅教材

书刊介绍

《Hadoop大数据分析技术》内容简介

伴随Hadoop的成长,Hadoop不再是一个简单的数据分布式存储平台和工具,已经成长为一个完整的生态圈。本书采用Hadoop3.2.2版本,系统讲解Hadoop生态系统主流的大数据分析技术。本书配套示例源码、PPT课件、教学大纲与编程环境。
本书共分11章。内容包括Hadoop概述与大数据环境准备、Hadoop伪分布式集群搭建、HDFS分布式存储实战、MapReduce实战、ZooKeeper与高可用集群实战、Hive数据仓库实战、HBase数据库实战、Flume数据采集实战、Kafka实战、影评大数据分析项目实战、旅游酒店评价大数据分析项目实战。
本书可作为Hadoop大数据技术初学者的入门书,也可作为Hadoop大数据分析工程师的指导手册,还可作为高等院校或者高职高专大数据专业的教材或教学参考书。
迟殿委,计算机软件与理论专业硕士,毕业于南昌大学,系统架构设计师。有多年企业软件研发经验和丰富的JavaEE培训经验,熟练掌握JavaEE全栈技术框架,对Java核心编程技术有深刻理解。主要擅长JavaEE系统架构设计、大数据分析与挖掘。

作品目录

内容简介
前言
本书内容
本书目的
本书适合的读者
配套源码、PPT课件等资源下载
第1章:Hadoop概述与大数据环境准备
1.1、大数据定义
1.2、Hadoop生态介绍
1.3、Hadoop
3新特性
1.4、虚拟机安装
1.5、安装Linux操作系统
1.6、SSH工具与使用
1.7、Linux统一设置
1.8、小结
第2章:Hadoop伪分布式集群搭建
2.1、安装独立运行的Hadoop
2.2、Hadoop伪分布式环境准备
2.3、Hadoop伪分布式安装
2.4、HDFS操作命令
2.5、Java项目访问HDFS
2.6、winutils
2.7、快速MapReduce程序示例
2.8、小结
第3章:HDFS分布式存储实战
3.1、HDFS的体系结构
3.2、NameNode的工作
3.3、SecondaryNameNode
3.4、DataNode
3.5、HDFS的命令
3.6、远程过程调用
3.7、小结
第4章:MapReduce实战
4.1、MapReduce的运算过程
4.2、WordCount示例
4.3、自定义Writable
4.4、Partitioner分区编程
4.5、自定义排序
4.6、Combiner编程
4.7、默认Mapper和默认Reducer
4.8、倒排索引
4.9、Shuffle
4.10、小结
第5章:ZooKeeper与高可用集群实战
5.1、ZooKeeper简介
5.2、单一节点安装ZooKeeper
5.3、基本客户端命令
5.4、Java代码操作ZooKeeper
5.5、ZooKeeper集群安装
5.6、znode节点类型
5.7、观察节点
5.8、配置Hadoop高可用集群
5.9、用Java代码操作集群
5.10、小结
第6章:Hive数据仓库实战
6.1、Hive3的安装配置
6.2、Hive的命令
6.3、Hive内部表
6.4、Hive外部表
6.5、Hive表分区
6.6、查询示例汇总
6.7、Hive函数
6.8、Hive自定义函数
6.9、Hive视图
6.10、hiveserver2、6.11、使用JDBC连接hiveserver2、6.12、小结
第7章:HBase数据库实战
7.1、HBase的特点
7.2、HBase安装
7.3、HBase集群安装
7.4、HBase
Shell操作
7.5、协处理器
7.6、Phoenix
7.7、小结
第8章:Flume数据采集实战
8.1、Flume的安装与配置
8.2、快速示例
8.3、在ZooKeeper中保存Flume的配置文件
8.4、Flume的更多Source
8.5、小结
第9章:Kafka实战
9.1、Kafka的特点
9.2、Kafka术语
9.3、Kafka安装与部署
9.4、小结
第10章:影评大数据分析项目实战
10.1、项目介绍
10.2、项目需求分析
10.3、项目详细实现
第11章:旅游酒店评价大数据分析项目实战
11.1、项目介绍
11.2、项目需求分析
11.3、项目详细实现

相关推荐

微信二维码