作品简介

本书以精练的语言介绍HBase的基础知识,让初学者能够快速上手使用HBase,对HBase的核心思想(如数据读取、数据备份等)和HBase架构(如LSM树、WAL)有深入的分析,并且让有经验的HBase开发人员也能够循序渐进地深入理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,使HBase集群响应延迟更低。本书结合企业必备的“用户行为分析系统”,让读者能够快速上手的同时,也不乏企业HBase实际应用场景,理论不脱离实际,真正做到从入门到精通。

本书适合有一定Java基础的程序员作为HBase入门教程,HBase运维人员可以将本书作为参考手册来部署和监控HBase,正在将HBase应用到在线生产环境中的软件开发人员也可以参考本书来调优HBase在线集群性能。

彭旭,2009年毕业于武汉大学软件工程专业,近十年国内顶尖互联网企业工作经验,曾任阿里巴巴天猫技术部资深软件工程师、珠海市魅族科技有限公司架构师,现在在创业公司珠海市卓轩科技有限公司任合伙人。精通Java生态系统相关技术,对大数据存储、HBase系统调优有深刻理解,带领团队将云服务存储系统从MySQL迁移到HBase,每年为公司节省成本数百万元。

作品目录

  • 内容提要
  • 对本书的赞誉
  • 前言
  • 资源与支持
  • 第1章 HBase简介
  • 1.1 背景
  • 1.2 NoSQL与传统RDBMS
  • 1.3 应用场景
  • 第2章 HBase安装
  • 2.1 单机部署
  • 2.2 分布式部署
  • 2.3 集群增删节点
  • 第3章  HBase数据模型
  • 3.1 逻辑模型
  • 3.2 物理模型
  • 第4章 HBase shell
  • 4.1 数据定义语言
  • 4.2 数据操纵语言
  • 4.3 其他常用shell
  • 第5章 模式设计
  • 5.1 行键设计
  • 5.2 规避热点区间
  • 5.3 高表与宽表
  • 5.4 微信朋友圈设计
  • 第6章 客户端API
  • 6.1 Java客户端使用
  • 6.2 数据定义语言
  • 6.3 数据操纵语言
  • 6.4 过滤器
  • 6.5 事务
  • 第7章 架构实现
  • 7.1 存储
  • 7.2 数据写入读取
  • 第8章 协处理器
  • 8.1 观察者类型协处理器
  • 8.2 端点类型协处理器
  • 8.3 装载/卸载协处理器
  • 第9章 HBase性能调优
  • 9.1 客户端调优
  • 9.2 服务端调优
  • 第10章 集群间数据复制
  • 10.1 复制
  • 10.2 快照
  • 10.3 导出和导入
  • 10.4 复制表
  • 第11章 监控
  • 11.1 Hadoop监控
  • 11.2 HBase监控
  • 后记
  • 附录 常见问题
  • A.1 GC时间超长导致分区服务器宕机
  • A.2 Scanner租期过期
  • A.3 分区迁移异常
  • A.4 Windows运行HBase程序缺少winutil.exe
  • A.5 误删表数据
展开全部