Flink原理、实战与性能优化

Flink原理、实战与性能优化

作者:张利兵

出版社:机械工业

出版年:2019年4月

ISBN:9787111623533

所属分类:成功励志

书刊介绍

《Flink原理、实战与性能优化》内容简介

这是一部以实战为导向,能指导读者零基础掌握Flink并快速完成进阶的著作,从功能、原理、实战和调优等4个维度循序渐进地讲解了如何利用Flink进行分布式流式应用开发。作者是该领域的资深专家,现就职于第四范式,曾就职于明略数据。全书一共10章,逻辑上可以分为三个部分:第一部分(第1~2章)主要介绍了Flink的核心概念、特性、应用场景、基本架构,开发环境的搭建和配置,以及源代码的编译。第二部分(第3~9章)详细讲解了Flink的编程范式,各种编程接口的功能、应用场景和使用方法,以及核心模块和组件的原理和使用。第三部分(第10章)重点讲解了Flink的监控和优化,参数调优,以及对反压、Checkpoint和内存的优化。
张利兵,资深架构师,流式计算领域专家,第四范式华东区AI项目架构师,原明略数据华东区大数据架构师。有多年大数据、流式计算方面的开发经验,对Hadoop、Spark、Flink等大数据计算引擎有着非常深入的理解,积累了丰富的项目实践经验。先后利用相关技术为银行、证券、地铁等领域的头部企业构建了内部大数据平台,参与了基于Flink的实时反欺诈风控、实时地铁故障预警等流式计算平台的设计和研发。

作品目录

前言
第1章:Apache
Flink介绍
1.1、Apache
Flink是什么
1.2、数据架构的演变
1.3、Flink应用场景
1.4、Flink基本架构
1.5、本章小结
第2章:环境准备
2.1、运行环境介绍
2.2、Flink项目模板
2.3、Flink开发环境配置
2.4、运行Scala
REPL
2.5、Flink源码编译
2.6、本章小结
第3章:Flink编程模型
3.1、数据集类型
3.2、Flink编程接口
3.3、Flink程序结构
3.4、Flink数据类型
3.5、本章小结
第4章:DataStream
API介绍与使用
4.1、DataStream编程模型
4.2、时间概念与Watermark
4.3、Windows窗口计算
4.4、作业链和资源组
4.5、Asynchronous
I/O异步操作
4.6、本章小结
第5章:Flink状态管理和容错
5.1、有状态计算
5.2、Checkpoints和Savepoints
5.3、状态管理器
5.4、Querable
State
5.5、本章小结
第6章:DataSet
API介绍与使用
6.1、DataSet
API
6.2、迭代计算
6.3、广播变量与分布式缓存
6.4、语义注解
6.5、本章小结
第7章:Table
API
&
SQL介绍与使用
7.1、TableEnviroment概念
7.2、Flink
Table
API
7.3、Flink
SQL使用
7.4、自定义函数
7.5、自定义数据源
7.6、本章小结
第8章:Flink组件栈介绍与使用
8.1、Flink复杂事件处理
8.2、Flink
Gelly图计算应用
8.3、FlinkML机器学习应用
8.4、本章小结
第9章:Flink部署与应用
9.1、Flink集群部署
9.2、Flink高可用配置
9.3、Flink安全管理
9.4、Flink集群升级
9.5、本章小结
第10章:Flink监控与性能优化
10.1、监控指标
10.2、Backpressure监控与优化
10.3、Checkpointing监控与优化
10.4、Flink内存优化
10.5、本章小结

相关推荐

微信二维码