基于Apache Kylin构建大数据分析平台

基于Apache Kylin构建大数据分析平台

作者:蒋守壮

出版社:清华大学

出版年:2017年1月

ISBN:9787302454526

所属分类:人文社科

书刊介绍

《基于Apache Kylin构建大数据分析平台》内容简介

Apache Kylin是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay公司开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。本书分为21章,详细讲解Apache Kylin概念、安装、配置、部署,让读者对Apache Kylin构建大数据分析平台有一个感性认识。同时,本书从应用角度,结合Dome和实例介绍了用于多维分析的Cube算法的创建、配置与优化。最后还介绍了Kyligence公司发布KAP大数据分析平台,对读者有极大的参考价值。
本书适合大数据技术初学者、大数据分析人员、大数据架构师等,也适合用于高等院校和培训学校相关专业师生教学参考。

作品目录

内容简介
推荐序
前言
致谢
第一部分
Apache
Kylin基础部分
第1章:Apache
Kylin前世今生
1.1、Apache
Kylin的背景
1.2、Apache
Kylin的应用场景
1.3、Apache
Kylin的发展历程
第2章:Apache
Kylin前奏
2.1、事实表和维表
2.2、星型模型和雪花型模型
2.3、OLAP
2.4、数据立方体(Data
Cube)
第3章:Apache
Kylin工作原理和体系架构
3.1、Kylin工作原理
3.2、Kylin体系架构
3.3、Kylin中的核心部分:Cube构建
3.4、Kylin的SQL查询
3.5、Kylin的特性和生态圈
第4章:搭建CDH大数据平台
4.1、系统环境和安装包
4.2、准备工作:系统环境搭建
4.3、正式安装CDH:准备工作
4.4、正式安装CDH5:安装配置
第5章:使用Kylin构建企业大数据分析平台的4种部署方式
5.1、Kylin部署的架构
5.2、Kylin的四种典型部署方式
第6章:单独为Kylin部署HBase集群
第7章:部署Kylin集群环境
7.1、部署Kylin的先决条件
7.2、部署Kylin集群环境
7.3、为Kylin集群搭建负载均衡器
第二部分
Apache
Kylin进阶部分
第8章:Demo案例实战
8.1、Sample
Cube案例描述
8.2、Sample
Cube案例实战
第9章:多维分析的Cube创建实战
9.1、Cube模型
9.2、创建Cube的流程
第10章:Build
Cube的来龙去脉
10.1、流程分析
10.2、小结
第三部分
Apache
Kylin高级部分
第11章:Cube优化
第12章:备份Kylin的Metadata
12.1、Kylin的元数据
12.2、备份元数据
12.3、恢复元数据
第13章:使用Hive视图
13.1、使用Hive视图
13.2、使用视图实战
第14章:Kylin的垃圾清理
14.1、清理元数据
14.2、清理存储器数据
第15章:JDBC访问方式
第16章:通过RESTful访问Kylin
第17章:Kylin版本之间升级
17.1、从1.5.2升级到最新版本1.5.3、17.2、从1.5.1升级到1.5.2版本
17.3、从Kylin
1.5.2.1升级到Kylin
1.5.3实战
17.4、补充内容
第18章:大数据可视化实践
18.1、可视化工具简述
18.2、安装Kylin
ODBC驱动
18.3、通过Excel访问Kylin
18.4、通过Power
BI访问Kylin
18.5、通过Tableau访问Kylin
18.6、Kylin
+
Mondrian
+
Saiku
18.7、实战演练:通过Saiku访问Kylin
18.8、通过Apache
Zepplin访问Kylin
18.9、通过Kylin的“Insight”查询
第19章:使用Streaming
Table构建准实时Cube
第20章:快速数据立方算法
20.1、快速数据立方算法概述
20.2、快速数据立方算法优点和缺点
20.3、获取Fast
Cubing算法的优势
第四部分
Apache
Kylin的扩展部分
第21章:大数据智能分析平台KAP
21.1、大数据智能分析平台KAP概述
21.2、KAP的安装部署

相关推荐

微信二维码