作品简介

这是一本通过分析ClickHouse底层引擎架构来解读ClickHouse极致性能的底层逻辑的著作,同时还总结了ClickHouse在各种适用场景中的使用技巧和性能调优方法,让读者知其然,也能知其所以然。

全书一共12章,分为两个部分:

第1部分:架构篇(第1—7章)简要地介绍了数据仓库的核心技术和思路,系统讲解了ClickHouse的查询性能优势、适用场景、架构设计和运作过程,深入地剖析了ClickHouse的存储引擎架构、计算引擎架构以及决定ClickHouse性能的关键因素,还将ClickHouse与其他数仓架构进行了深度对比,不仅阐明了ClickHouse查询速度快的底层逻辑,也推导出了ClickHouse的适用场景。

第2部分:实战篇(第8—12章)针对ClickHouse的适用场景,讲解了它的各种使用技巧以及存算分离架构、分布式架构等云计算时代的全新架构,更重要的是,从数据结构、内存、磁盘、网络、CPU、查询等方面全面总结了ClickHouse的性能优化方法和原则。

陈峰,资深大数据专家和架构师,ClickHouse技术专家,滴普科技(2B领域独角兽)合伙人兼首席架构师,从0到1地建设了首支滴普科技的数据中台技术团队,构建了滴普科技的数据技术体系。

有多年的大数据架构经验,作者曾担任百丽数据中台丽影洞察项目的大数据架构师,将ClickHouse成功引入百丽。

曾在中国数据库技术大会(Database Technology Conference China,DTCC)等多个会议上发表ClickHouse主题演讲,对ClickHouse有非常深入的研究,实践经验丰富。

积极参与ClickHouse社区活动,积极推广ClickHouse。在多个项目中应用ClickHouse技术,将ClickHouse的强大能力推广到企业中,同时积极地向ClickHouse社区贡献代码和开源工具。

作品目录

  • Praise 赞誉
  • Foreword 序1
  • Foreword 序2
  • 自序 Foreword
  • 前言 Preface
  • Part 1 第一部分 架构篇
  • Chapter 1 第1章 数据仓库的核心技术
  • 1.1 OLAP和OLTP的本质区别
  • 1.2 典型大数据数仓技术及其核心思路
  • 1.3 传统数仓的缺陷
  • 1.4 ClickHouse查询性能的优势
  • 1.5 本章小结
  • Chapter 2 第2章 ClickHouse简介
  • 2.1 ClickHouse的4个标签
  • 2.2 ClickHouse的3个适用场景
  • 2.3 本章小结
  • Chapter 3 第3章 ClickHouse架构概览
  • 3.1 ClickHouse架构简介
  • 3.2 ClickHouse的核心抽象
  • 3.3 ClickHouse的运作过程
  • 3.4 本章小结
  • Chapter 4 第4章 MergeTree存储引擎架构
  • 4.1 MergeTree存储引擎的三大特点
  • 4.2 MergeTree的数据组织
  • 4.3 MergeTree的文件组织
  • 4.4 索引
  • 4.5 与事务数据库存储引擎的对比
  • 4.6 存储引擎如何影响查询速度
  • 4.7 MergeTree存储引擎的工作过程
  • 4.8 本章小结
  • Chapter 5 第5章 ClickHouse计算引擎架构
  • 5.1 ClickHouse计算引擎的架构简介与设计思想
  • 5.2 火山模型
  • 5.3 向量化引擎
  • 5.4 计算引擎如何影响查询速度
  • 5.5 本章小结
  • Chapter 6 第6章 ClickHouse与其他数仓架构的对比
  • 6.1 ClickHouse与Hive的对比
  • 6.2 ClickHouse与HBase的对比
  • 6.3 ClickHouse与Kylin的对比
  • 6.4 本章小结
  • Chapter 7 第7章 深度思考:决定外在能力的因素
  • 7.1 从架构层面分析ClickHouse
  • 7.2 结构决定功能
  • 7.3 从ClickHouse的设计来理解
  • 7.4 本章小结
  • Part 2 第二部分 实战篇
  • Chapter 8 第8章 ClickHouse使用技巧
  • 8.1 数据导入、导出技巧
  • 8.2 建表技巧
  • 8.3 高级技巧
  • 8.4 常见报错及处理方法
  • 8.5 本章小结
  • Chapter 9 第9章 ClickHouse实现用户画像系统
  • 9.1 用户画像概述
  • 9.2 用户画像系统的关键技术实现
  • 9.3 基于ClickHouse的用户画像系统的优点
  • 9.4 本章小结
  • Chapter 10 第10章 ClickHouse的存算分离架构
  • 10.1 存算分离架构背景
  • 10.2 ClickHouse中的存算分离
  • 10.3 存算分离架构给ClickHouse带来的优势
  • 10.4 本章小结
  • Chapter 11 第11章 ClickHouse的分布式架构
  • 11.1 架构特点及对比
  • 11.2 基本概念
  • 11.3 ClickHouse的复制表引擎
  • 11.4 ClickHouse分布式表引擎
  • 11.5 本章小结
  • Chapter 12 第12章 ClickHouse性能优化
  • 12.1 性能优化的原则
  • 12.2 数据结构优化
  • 12.3 内存优化
  • 12.4 磁盘优化
  • 12.5 网络优化
  • 12.6 CPU优化
  • 12.7 查询优化
  • 12.8 数据迁移优化
  • 12.9 本章小结
展开全部