作品简介

《Hadoop3大数据技术快速入门/大数据技术丛书》基于Hadoop3.3.0,覆盖Hadoop、HBase、Hive的核心概念、实践应用、程序开发等方面的内容,帮你快速解决大数据是什么和怎么用的问题,书中还利用Docker来部署Hadoop分布式集群,让你同时学会4种流行的技术。

《Hadoop3大数据技术快速入门/大数据技术丛书》共9章,主要内容包括Hadoop概述、HDFS原理详解、Yarn原理详解、Hadoop系统配置、高可用Hadoop配置、HDFS编程、MapReduce编程、Hive实战、HBase实战。

《Hadoop3大数据技术快速入门/大数据技术丛书》从案例入手、通俗易懂,能使读者在非常短时间内迅速掌握Hadoop大数据技术。

《Hadoop3大数据技术快速入门/大数据技术丛书》既适合Hadoop大数据初学者、大数据应用开发人员、大数据处理人员使用,也适合高等院校和培训机构大数据相关专业的师生教学参考。

牛搞,软件开发从业15年编程实战经验,流媒体技术专家,高性能服务器专家。CSDN知名博主。现为IOS、Adroid、C++高级培训讲师。著有图书《Android9编程通俗演义》《Android10Kotlin编程通俗演义》。

作品目录

  • 内容简介
  • 前言
  • 第1章 概述
  • 1.1 什么是大数据
  • 1.2 Hadoop的原理
  • 1.3 总结
  • 第2章 HDFS原理详解
  • 2.1 主从节点架构
  • 2.2 数据冗余
  • 2.3 fsimage与edits
  • 2.4 SecondaryNameNode
  • 2.5 HA
  • 2.6 自动故障转移
  • 2.7 ZooKeeper
  • 2.8 防脑裂
  • 2.9 联邦
  • 2.10 总结
  • 第3章 Yarn原理详解
  • 3.1 概述
  • 3.2 作业调度策略
  • 3.3 Yarn与MapReduce程序
  • 第4章 配置Hadoop系统
  • 4.1 Docker简介
  • 4.2 安装Docker
  • 4.3 创建Hadoop容器
  • 4.4 配置独立模式Hadoop
  • 4.5 配置伪分布Hadoop
  • 4.6 基于Dockerfile的伪分布Hadoop
  • 4.7 配置全分布式Hadoop
  • 4.8 Windows下运行Hadoop
  • 4.9 Yarn调度配置
  • 第5章 配置高可用Hadoop
  • 5.1 HDFS高可用
  • 5.2 Yarn高可用
  • 第6章 HDFS编程
  • 6.1 安装开发工具
  • 6.2 Native编程
  • 6.3 WebHDFS与HttpFS
  • 第7章 MapReduce编程
  • 7.1 准备测试环境与创建项目
  • 7.2 添加MapReduce逻辑
  • 7.3 创建Job
  • 7.4 添加依赖库
  • 7.5 运行程序
  • 7.6 查看运行日志
  • 7.7 在Hadoop中运行程序
  • 7.8 Combiner
  • 7.9 Mapper与Reducer数量
  • 7.10 实现SQL语句
  • 7.11 实现SQL JOIN
  • 7.12 Counter
  • 7.13 其他组件
  • 7.14 升级版的WordCount
  • 7.15 分布式k-means
  • 第8章 Hive
  • 8.1 Hive的设计架构
  • 8.2 运行架构
  • 8.3 安装配置Hive3
  • 8.4 运行Hive3
  • 8.5 其他运行方式
  • 8.6 Hive数据管理
  • 8.7 Hive查询优化
  • 8.8 索引
  • 8.9 HCatalog
  • 8.10 Hive编程
  • 8.11 总结
  • 第9章 HBase
  • 9.1 什么是HBase
  • 9.2 HBase架构
  • 9.3 安装与配置
  • 9.4 基本数据操作
  • 9.5 HBase设计原理
  • 9.6 HBase应用编程
  • 9.7 总结
  • 后记
展开全部