Hadoop 3大数据技术快速入门

Hadoop 3大数据技术快速入门

作者:牛搞

出版社:清华大学

出版年:2021年8月

ISBN:9787302586463

所属分类:经济金融

书刊介绍

《Hadoop 3大数据技术快速入门》内容简介

《Hadoop3大数据技术快速入门/大数据技术丛书》基于Hadoop3.3.0,覆盖Hadoop、HBase、Hive的核心概念、实践应用、程序开发等方面的内容,帮你快速解决大数据是什么和怎么用的问题,书中还利用Docker来部署Hadoop分布式集群,让你同时学会4种流行的技术。
《Hadoop3大数据技术快速入门/大数据技术丛书》共9章,主要内容包括Hadoop概述、HDFS原理详解、Yarn原理详解、Hadoop系统配置、高可用Hadoop配置、HDFS编程、MapReduce编程、Hive实战、HBase实战。
《Hadoop3大数据技术快速入门/大数据技术丛书》从案例入手、通俗易懂,能使读者在非常短时间内迅速掌握Hadoop大数据技术。
《Hadoop3大数据技术快速入门/大数据技术丛书》既适合Hadoop大数据初学者、大数据应用开发人员、大数据处理人员使用,也适合高等院校和培训机构大数据相关专业的师生教学参考。
牛搞,软件开发从业15年编程实战经验,流媒体技术专家,高性能服务器专家。CSDN知名博主。现为IOS、Adroid、C++高级培训讲师。著有图书《Android9编程通俗演义》《Android10Kotlin编程通俗演义》。

作品目录

内容简介
前言
第1章:概述
1.1、什么是大数据
1.2、Hadoop的原理
1.3、总结
第2章:HDFS原理详解
2.1、主从节点架构
2.2、数据冗余
2.3、fsimage与edits
2.4、SecondaryNameNode
2.5、HA
2.6、自动故障转移
2.7、ZooKeeper
2.8、防脑裂
2.9、联邦
2.10、总结
第3章:Yarn原理详解
3.1、概述
3.2、作业调度策略
3.3、Yarn与MapReduce程序
第4章:配置Hadoop系统
4.1、Docker简介
4.2、安装Docker
4.3、创建Hadoop容器
4.4、配置独立模式Hadoop
4.5、配置伪分布Hadoop
4.6、基于Dockerfile的伪分布Hadoop
4.7、配置全分布式Hadoop
4.8、Windows下运行Hadoop
4.9、Yarn调度配置
第5章:配置高可用Hadoop
5.1、HDFS高可用
5.2、Yarn高可用
第6章:HDFS编程
6.1、安装开发工具
6.2、Native编程
6.3、WebHDFS与HttpFS
第7章:MapReduce编程
7.1、准备测试环境与创建项目
7.2、添加MapReduce逻辑
7.3、创建Job
7.4、添加依赖库
7.5、运行程序
7.6、查看运行日志
7.7、在Hadoop中运行程序
7.8、Combiner
7.9、Mapper与Reducer数量
7.10、实现SQL语句
7.11、实现SQL
JOIN
7.12、Counter
7.13、其他组件
7.14、升级版的WordCount
7.15、分布式k-means
第8章:Hive
8.1、Hive的设计架构
8.2、运行架构
8.3、安装配置Hive3、8.4、运行Hive3、8.5、其他运行方式
8.6、Hive数据管理
8.7、Hive查询优化
8.8、索引
8.9、HCatalog
8.10、Hive编程
8.11、总结
第9章:HBase
9.1、什么是HBase
9.2、HBase架构
9.3、安装与配置
9.4、基本数据操作
9.5、HBase设计原理
9.6、HBase应用编程
9.7、总结
后记

相关推荐

微信二维码