作品简介

这不仅是一本从原理到使用、从入门到进阶讲解Greenplum的著作,而且是一本指导企业用更省钱、更高效地方式使用Greenplum构建企业级数据仓库和数据中台的著作。

作者在数据架构和数据仓库一线工作10余年,积累了丰富的项目经验,他用浅显易懂的语言、贴近生产环境的案例、丰富的示意图例写作了本书,能帮助读者快速掌握具有实战价值的知识。

具体地,阅读本书你将收获如下内容:

掌握数据仓库技术的发展历程和发展方向;

理解MPP架构的架构特点和实现逻辑;

Greenplum数据库的安装和基本操作;

Greenplum数据库的工作原理;

王春波

资深架构师和数据仓库专家,现任上海启高信息科技有限公司大数据架构师,Apache Doris和openGauss贡献者,Greenplum中文社区参与者。

具有十多年的数据仓库、数据集市、数据中台项目实战经验,对大数据主流技术架构、产品选型与解决方案有深入研究,尤其擅长用优雅的SQL实现复杂的逻辑。

常年奔波在各个项目交付现场,曾成功主导过中国邮政储蓄银行、南海农商银行、广东省联社、前海微众银行、广东南粤银行等多家银行的管理会计项目,以及卡宾、安踏、特步等多家零售鞋服企业的数据中台项目。

公众号“数据中台研习社”运营者。

作品目录

  • 推荐语
  • 序一
  • 序二
  • 序三
  • 前言
  • 第一部分大数据平台概述
  • 第1章 大数据平台技术的演进
  • 1.1 关系型数据库
  • 1.2 Hadoop生态系统
  • 1.3 NoSQL的瓶颈和SQL数据库的回归
  • 1.4 MPP架构的兴起
  • 第二部分Greenplum入门
  • 第2章 Greenplum概述
  • 2.1 Greenplum的前世今生
  • 2.2 Greenplum数据库架构
  • 2.3 Greenplum数据库的特点
  • 2.4 Greenplum新特性及展望
  • 2.5 Greenplum的优势
  • 第3章 Greenplum的安装与部署
  • 3.1 Greenplum数据库安装过程
  • 3.2 安装GPCC
  • 3.3 Greenplum访问接口
  • 3.4 Greenplum数据库常用命令
  • 3.5 Greenplum性能测试
  • 第4章 Greenplum使用入门
  • 4.1 数据类型详解
  • 4.2 数据表的基本使用
  • 4.3 数据表的高级应用
  • 4.4 数据库函数
  • 4.5 数据库的其他对象
  • 第三部分Greenplum应用
  • 第5章 Greenplum查询详解
  • 5.1 SQL语法
  • 5.2 JOIN操作
  • 5.3 分析函数的妙用
  • 5.4 高级函数精选
  • 第6章 ETL工具箱
  • 6.1 数据加载王者GPLoad
  • 6.2 自定义存储过程
  • 6.3 PXF插件
  • 6.4 DBLink
  • 6.5 拉链表
  • 第7章 Greenplum高级应用
  • 7.1 开放的编程接口
  • 7.2 MADlib机器学习库
  • 7.3 半结构化数据分析
  • 7.4 地理空间数据分析
  • 7.5 图计算应用
  • 第8章 Greenplum运维管理和监控
  • 8.1 数据库管理
  • 8.2 可视化监控页面—GPCC
  • 8.3 管理好帮手—gp_toolkit
  • 8.4 Greenplum备份和恢复
  • 8.5 在线扩容工具GPExpand
  • 8.6 锁机制
  • 第9章 Greenplum性能优化
  • 9.1 系统级优化
  • 9.2 数据库级优化
  • 9.3 表级优化
  • 9.4 执行计划和查询优化
  • 第10章 Greenplum与开源组件
  • 10.1 Kettle
  • 10.2 DataX
  • 10.3 HDFS、Hive和HBase
  • 10.4 Spark
  • 10.5 Kafka
  • 10.6 Flink
  • 第11章 Greenplum与BI应用
  • 11.1 Tableau
  • 11.2 永洪BI
  • 11.3 帆软BI
  • 11.4 DataV
  • 11.5 Quick BI
  • 第四部分数据中台实战
  • 第12章 数据中台建设思路
  • 12.1 为什么要搭建数据中台
  • 12.2 什么是数据中台
  • 12.3 如何搭建数据中台
  • 12.4 数据中台怎么选型
  • 第13章 接口数据同步
  • 13.1 全量接口同步
  • 13.2 增量接口同步
  • 13.3 流式数据同步
  • 13.4 日志流数据同步
  • 第14章 数据建模
  • 14.1 数据建模思想
  • 14.2 数据分层设计
  • 14.3 数据分层实战案例
  • 14.4 数据中台命名规范
  • 第15章 数据中台主要配套功能
  • 15.1 数据权限管理
  • 15.2 数据补录
  • 15.3 BI门户
  • 15.4 元数据管理
  • 15.5 指标管理
  • 第16章 数据中台数据应用
  • 16.1 商业智能
  • 16.2 自助分析平台
  • 16.3 数据服务
  • 16.4 标签平台
  • 16.5 推荐系统
  • 第17章 基于Greenplum的数据中台实践案例
  • 17.1 项目背景
  • 17.2 项目需求
  • 17.3 项目技术实现
  • 17.4 智能数据应用
  • 17.5 典型技术方案分享
  • 17.6 典型业务方案分享
  • 17.7 项目总结
展开全部