ClickHouse性能之巅:从架构设计解读性能之谜

ClickHouse性能之巅:从架构设计解读性能之谜

作者:陈峰

出版社:机械工业

出版年:2022年9月

ISBN:9787111716587

所属分类:历史文化

书刊介绍

《ClickHouse性能之巅:从架构设计解读性能之谜》内容简介

这是一本通过分析ClickHouse底层引擎架构来解读ClickHouse极致性能的底层逻辑的著作,同时还总结了ClickHouse在各种适用场景中的使用技巧和性能调优方法,让读者知其然,也能知其所以然。
全书一共12章,分为两个部分: 第1部分:架构篇(第1—7章)简要地介绍了数据仓库的核心技术和思路,系统讲解了ClickHouse的查询性能优势、适用场景、架构设计和运作过程,深入地剖析了ClickHouse的存储引擎架构、计算引擎架构以及决定ClickHouse性能的关键因素,还将ClickHouse与其他数仓架构进行了深度对比,不仅阐明了ClickHouse查询速度快的底层逻辑,也推导出了ClickHouse的适用场景。
第2部分:实战篇(第8—12章)针对ClickHouse的适用场景,讲解了它的各种使用技巧以及存算分离架构、分布式架构等云计算时代的全新架构,更重要的是,从数据结构、内存、磁盘、网络、CPU、查询等方面全面总结了ClickHouse的性能优化方法和原则。
陈峰,资深大数据专家和架构师,ClickHouse技术专家,滴普科技(2B领域独角兽)合伙人兼首席架构师,从0到1地建设了首支滴普科技的数据中台技术团队,构建了滴普科技的数据技术体系。
有多年的大数据架构经验,作者曾担任百丽数据中台丽影洞察项目的大数据架构师,将ClickHouse成功引入百丽。
曾在中国数据库技术大会(Database Technology Conference China,DTCC)等多个会议上发表ClickHouse主题演讲,对ClickHouse有非常深入的研究,实践经验丰富。
积极参与ClickHouse社区活动,积极推广ClickHouse。在多个项目中应用ClickHouse技术,将ClickHouse的强大能力推广到企业中,同时积极地向ClickHouse社区贡献代码和开源工具。

作品目录

Praise
赞誉
Foreword
序1、Foreword
序2、自序
Foreword
前言
Preface
Part
1、第一部分
架构篇
Chapter
1、第1章:数据仓库的核心技术
1.1、OLAP和OLTP的本质区别
1.2、典型大数据数仓技术及其核心思路
1.3、传统数仓的缺陷
1.4、ClickHouse查询性能的优势
1.5、本章小结
Chapter
2、第2章:ClickHouse简介
2.1、ClickHouse的4个标签
2.2、ClickHouse的3个适用场景
2.3、本章小结
Chapter
3、第3章:ClickHouse架构概览
3.1、ClickHouse架构简介
3.2、ClickHouse的核心抽象
3.3、ClickHouse的运作过程
3.4、本章小结
Chapter
4、第4章:MergeTree存储引擎架构
4.1、MergeTree存储引擎的三大特点
4.2、MergeTree的数据组织
4.3、MergeTree的文件组织
4.4、索引
4.5、与事务数据库存储引擎的对比
4.6、存储引擎如何影响查询速度
4.7、MergeTree存储引擎的工作过程
4.8、本章小结
Chapter
5、第5章:ClickHouse计算引擎架构
5.1、ClickHouse计算引擎的架构简介与设计思想
5.2、火山模型
5.3、向量化引擎
5.4、计算引擎如何影响查询速度
5.5、本章小结
Chapter
6、第6章:ClickHouse与其他数仓架构的对比
6.1、ClickHouse与Hive的对比
6.2、ClickHouse与HBase的对比
6.3、ClickHouse与Kylin的对比
6.4、本章小结
Chapter
7、第7章:深度思考:决定外在能力的因素
7.1、从架构层面分析ClickHouse
7.2、结构决定功能
7.3、从ClickHouse的设计来理解
7.4、本章小结
Part
2、第二部分
实战篇
Chapter
8、第8章:ClickHouse使用技巧
8.1、数据导入、导出技巧
8.2、建表技巧
8.3、高级技巧
8.4、常见报错及处理方法
8.5、本章小结
Chapter
9、第9章:ClickHouse实现用户画像系统
9.1、用户画像概述
9.2、用户画像系统的关键技术实现
9.3、基于ClickHouse的用户画像系统的优点
9.4、本章小结
Chapter
10、第10章:ClickHouse的存算分离架构
10.1、存算分离架构背景
10.2、ClickHouse中的存算分离
10.3、存算分离架构给ClickHouse带来的优势
10.4、本章小结
Chapter
11、第11章:ClickHouse的分布式架构
11.1、架构特点及对比
11.2、基本概念
11.3、ClickHouse的复制表引擎
11.4、ClickHouse分布式表引擎
11.5、本章小结
Chapter
12、第12章:ClickHouse性能优化
12.1、性能优化的原则
12.2、数据结构优化
12.3、内存优化
12.4、磁盘优化
12.5、网络优化
12.6、CPU优化
12.7、查询优化
12.8、数据迁移优化
12.9、本章小结

相关推荐

微信二维码