Flink设计与实现:核心原理与源码解析

Flink设计与实现:核心原理与源码解析

作者:张利兵

出版社:机械工业

出版年:2021年8月

ISBN:9787111687832

所属分类:历史文化

书刊介绍

《Flink设计与实现:核心原理与源码解析》内容简介

全书共8章:第1章介绍Flink设计理念与基本架构;第2章介绍DataStream的设计与实现;第3章介绍运行时的核心原理与实现,包括Dispatcher、ResourceManager以及JobManager等核心组件的源码级解析和介绍;第4章介绍Flink任务提交与执行的整体流程,包括客户端实现、运行时作业执行过程、JobGraph及ExecutionGraph图转换等;第5章介绍不同的集群部署模式,包括On Yarn、On Kubernetes等;第6章介绍状态管理与容错,包括不同类型状态后端的设计与实现;第7章介绍Flink网络通信,包括RPC通信以及基于Netty实现的网络栈;第8章介绍Flink内存管理,包括MemorySegment的设计与实现等。
张利兵,资深架构师,流式计算领域专家,第四范式华东区AI项目架构师,原明略数据华东区大数据架构师。有多年大数据、流式计算方面的开发经验,对Hadoop、Spark、Flink等大数据计算引擎有着非常深入的理解,积累了丰富的项目实践经验。先后利用相关技术为银行、证券、地铁等领域的头部企业构建了内部大数据平台,参与了基于Flink的实时反欺诈风控、实时地铁故障预警等流式计算平台的设计和研发。

作品目录

前言
第1章:Flink设计理念与基本架构
1.1、Flink基本设计思想
1.2、Flink整体架构
1.3、Flink源码分析与编译
1.4、本章小结
第2章:DataStream的设计与实现
2.1、DataStream
API的主要组成
2.2、StreamOperator的定义与实现
2.3、Function的定义与实现
2.4、TimerService的设计与实现
2.5、DataStream核心转换
2.6、本章小结
第3章:运行时的核心原理与实现
3.1、运行时的整体架构
3.2、运行时组件的创建和启动
3.3、集群资源管理
3.4、系统高可用与容错
3.5、本章小结
第4章:任务提交与执行
4.1、客户端作业提交
4.2、ExecutionEnvironment初始化
4.3、将Pipeline转换成JobGraph
4.4、JobGraph的接收与运行
4.5、ExecutionGraph的调度与执行
4.6、Task的执行与注销
4.7、本章小结
第5章:集群部署模式
5.1、基本概念
5.2、Flink
On
Yarn的设计与实现
5.3、Flink
On
Kubernetes的设计与实现
5.4、本章小结
第6章:状态管理与容错
6.1、状态数据管理
6.2、KeyedState的创建与管理
6.3、OperatorState的创建与管理
6.4、StateBackend详解
6.5、Checkpoint的设计与实现
6.6、本章小结
第7章:网络通信
7.1、集群RPC通信机制
7.2、NetworkStack的设计与实现
7.3、基于信用值的反压机制实现
7.4、本章小结
第8章:内存管理
8.1、内存管理概述
8.2、MemorySegment的设计与实现
8.3、DataInputView与DataOutputView
8.4、数据序列化与反序列化
8.5、本章小结

相关推荐

微信二维码