作品简介

伴随Hadoop的成长,Hadoop不再是一个简单的数据分布式存储平台和工具,已经成长为一个完整的生态圈。本书采用Hadoop3.2.2版本,系统讲解Hadoop生态系统主流的大数据分析技术。本书配套示例源码、PPT课件、教学大纲与编程环境。

本书共分11章。内容包括Hadoop概述与大数据环境准备、Hadoop伪分布式集群搭建、HDFS分布式存储实战、MapReduce实战、ZooKeeper与高可用集群实战、Hive数据仓库实战、HBase数据库实战、Flume数据采集实战、Kafka实战、影评大数据分析项目实战、旅游酒店评价大数据分析项目实战。

本书可作为Hadoop大数据技术初学者的入门书,也可作为Hadoop大数据分析工程师的指导手册,还可作为高等院校或者高职高专大数据专业的教材或教学参考书。

迟殿委,计算机软件与理论专业硕士,毕业于南昌大学,系统架构设计师。有多年企业软件研发经验和丰富的JavaEE培训经验,熟练掌握JavaEE全栈技术框架,对Java核心编程技术有深刻理解。主要擅长JavaEE系统架构设计、大数据分析与挖掘。

作品目录

  • 内容简介
  • 前言
  • 本书内容
  • 本书目的
  • 本书适合的读者
  • 配套源码、PPT课件等资源下载
  • 第1章 Hadoop概述与大数据环境准备
  • 1.1 大数据定义
  • 1.2 Hadoop生态介绍
  • 1.3 Hadoop 3新特性
  • 1.4 虚拟机安装
  • 1.5 安装Linux操作系统
  • 1.6 SSH工具与使用
  • 1.7 Linux统一设置
  • 1.8 小结
  • 第2章 Hadoop伪分布式集群搭建
  • 2.1 安装独立运行的Hadoop
  • 2.2 Hadoop伪分布式环境准备
  • 2.3 Hadoop伪分布式安装
  • 2.4 HDFS操作命令
  • 2.5 Java项目访问HDFS
  • 2.6 winutils
  • 2.7 快速MapReduce程序示例
  • 2.8 小结
  • 第3章 HDFS分布式存储实战
  • 3.1 HDFS的体系结构
  • 3.2 NameNode的工作
  • 3.3 SecondaryNameNode
  • 3.4 DataNode
  • 3.5 HDFS的命令
  • 3.6 远程过程调用
  • 3.7 小结
  • 第4章 MapReduce实战
  • 4.1 MapReduce的运算过程
  • 4.2 WordCount示例
  • 4.3 自定义Writable
  • 4.4 Partitioner分区编程
  • 4.5 自定义排序
  • 4.6 Combiner编程
  • 4.7 默认Mapper和默认Reducer
  • 4.8 倒排索引
  • 4.9 Shuffle
  • 4.10 小结
  • 第5章 ZooKeeper与高可用集群实战
  • 5.1 ZooKeeper简介
  • 5.2 单一节点安装ZooKeeper
  • 5.3 基本客户端命令
  • 5.4 Java代码操作ZooKeeper
  • 5.5 ZooKeeper集群安装
  • 5.6 znode节点类型
  • 5.7 观察节点
  • 5.8 配置Hadoop高可用集群
  • 5.9 用Java代码操作集群
  • 5.10 小结
  • 第6章 Hive数据仓库实战
  • 6.1 Hive3的安装配置
  • 6.2 Hive的命令
  • 6.3 Hive内部表
  • 6.4 Hive外部表
  • 6.5 Hive表分区
  • 6.6 查询示例汇总
  • 6.7 Hive函数
  • 6.8 Hive自定义函数
  • 6.9 Hive视图
  • 6.10 hiveserver2
  • 6.11 使用JDBC连接hiveserver2
  • 6.12 小结
  • 第7章 HBase数据库实战
  • 7.1 HBase的特点
  • 7.2 HBase安装
  • 7.3 HBase集群安装
  • 7.4 HBase Shell操作
  • 7.5 协处理器
  • 7.6 Phoenix
  • 7.7 小结
  • 第8章 Flume数据采集实战
  • 8.1 Flume的安装与配置
  • 8.2 快速示例
  • 8.3 在ZooKeeper中保存Flume的配置文件
  • 8.4 Flume的更多Source
  • 8.5 小结
  • 第9章 Kafka实战
  • 9.1 Kafka的特点
  • 9.2 Kafka术语
  • 9.3 Kafka安装与部署
  • 9.4 小结
  • 第10章 影评大数据分析项目实战
  • 10.1 项目介绍
  • 10.2 项目需求分析
  • 10.3 项目详细实现
  • 第11章 旅游酒店评价大数据分析项目实战
  • 11.1 项目介绍
  • 11.2 项目需求分析
  • 11.3 项目详细实现
展开全部