Flink与Kylin深度实践

Flink与Kylin深度实践

作者:开课吧 组编王超 李沙 编著

出版社:机械工业

出版年:2020年8月

ISBN:9787111660170

所属分类:经济金融

书刊介绍

《Flink与Kylin深度实践》内容简介

本书从实用角度出发,首先介绍了Flink的功能模块、运行模式、部署安装等内容,然后着重介绍了Flink中的实时处理技术和批量处理技术,接着讲解了Flink的Table与SQL、CEP机制、调优与监控、实时数据同步解析,最后通过Flink结合Kylin实现了实时数据统计的功能。本书内容全面,由浅入深,包含大量的代码示例,并提供下载服务,每章配有重要知识点串讲视频和小结,以指导读者轻松入门。本书适合有一定编程及大数据开发经验,有数据实时处理工作需求或者想要从事相关工作的读者阅读。
开课吧组编;王超,李沙编著

作品目录

致数字化人才的一封信
前言
第1章:Flink及其运行模式简介
1.1、Flink介绍
1.2、Flink的特性
1.3、功能模块
1.4、编程模型
1.5、重新编译
1.6、任务提交模型
1.7、部署运行模式
1.8、本章小结
第2章:Flink的部署安装及入门案例
2.1、local模式部署安装
2.2、standalone模式部署安装
2.3、standalone模式的HA环境
2.4、standalone模式在HA环境下提交任务
2.5、Flink
on
YARN模式
2.6、入门案例
2.7、shell命令行代码调试
2.8、本章小结
第3章:Flink实时处理之DataStream
3.1、DataStream的数据源
3.2、DataStream常用算子
3.3、窗口和时间
3.4、用watermark解决乱序与数据延迟问题
3.5、DataStream的状态保存和恢复
3.6、DataStream集成Kafka
3.7、本章小结
第4章:Flink批量处理之DataSet
4.1、DataSet的内置数据源
4.2、DataSet常用算子
4.3、DataSet的参数传递
4.4、DataSet连接器
4.5、广播变量、累加器与分布式缓存
4.6、本章小结
第5章:Flink的Table与SQL
5.1、Table与SQL简介
5.2、为什么需要SQL
5.3、Table与SQL的语法解析
5.4、Table与SQL编程开发
5.5、本章小结
第6章:Flink数据去重与数据连接
6.1、数据去重
6.2、流的连接实现
6.3、本章小结
第7章:Flink中的复杂事件处理(CEP)机制
7.1、CEP简介
7.2、CEP中的模式
7.3、CEP综合案例
7.4、本章小结
第8章:Flink调优与监控
8.1、监控指标
8.2、反压机制与监控
8.3、checkpoint监控
8.4、checkpoint调优
8.5、内存管理调优
8.6、本章小结
第9章:基于Flink实现实时数据同步解析
9.1、实时数仓架构
9.2、MySQL数据实时同步
9.3、数据库建表
9.4、开发模拟数据生成模块
9.5、数据获取模块开发
9.6、本章小结
第10章:基于Kylin的实时数据统计
10.1、Kylin简介
10.2、Kylin基础知识
10.3、Kylin环境搭建
10.4、Kylin的使用
10.5、Kylin的构建流程
10.6、Cube构建算法
10.7、Cube构建的优化
10.8、备份以及恢复Kylin的元数据
10.9、Kylin的垃圾清理
10.10、BI工具集成
10.11、使用Kylin分析HBase数据
10.12、本章小结

相关推荐

微信二维码