作品简介

本书采用“理论+实战”的形式编写,全面介绍了Hadoop大数据挖掘的相关知识。本书共分为13章,涵盖的主要内容有:集群及开发环境搭建;快速构建一个Hadoop项目并线上运行;Hadoop套件实战;Hive编程,使用SQL提交MapReduce任务到Hadoop集群;游戏玩家的用户行为分析,特征提取;Hadoop平台管理与维护;Hadoop异常处理解决方案;初识Hadoop核心源码;Hadoop通信机制和内部协议;Hadoop分布式文件系统剖析;ELK实战案例——游戏应用实时日志分析平台;Kafka实战案例,实时处理游戏用户数据;Hadoop拓展,Kafka剖析。本书不但适合刚入门的初学者系统学习Hadoop的各种基础语法和开发技巧,而且也适合有多年开发经验的开发者进阶提高。另外,本书也适合社会培训机构和相关院校作为教材或者教学参考书。

邓杰编著。

作品目录

  • 前言
  • 第1章 集群及开发环境搭建
  • 1.1 环境准备
  • 1.2 安装Hadoop
  • 1.3 Hadoop版Hello World
  • 1.4 开发环境
  • 1.5 小结
  • 第2章 实战:快速构建一个Hadoop项目并线上运行
  • 2.1 构建一个简单的项目工程
  • 2.2 操作分布式文件系统(HDFS)
  • 2.3 利用IDE提交MapReduce作业
  • 2.4 编译应用程序并打包
  • 2.5 部署与调度
  • 2.6 小结
  • 第3章 Hadoop套件实战
  • 3.1 Sqoop——数据传输工具
  • 3.2 Flume——日志收集工具
  • 3.3 HBase——分布式数据库
  • 3.4 Zeppelin——数据集分析工具
  • 3.5 Drill——低延时SQL查询引擎
  • 3.6 Spark——实时流数据计算
  • 3.7 小结
  • 第4章 Hive编程——使用SQL提交MapReduce任务到Hadoop集群
  • 4.1 环境准备与Hive初识
  • 4.2 安装与配置Hive
  • 4.3 可编程方式
  • 4.4 运维和监控
  • 4.5 小结
  • 第5章 游戏玩家的用户行为分析——特征提取
  • 5.1 项目应用概述
  • 5.2 分析与设计
  • 5.3 技术选型
  • 5.4 编码实践
  • 5.5 小结
  • 第6章 Hadoop平台管理与维护
  • 6.1 Hadoop分布式文件系统(HDFS)
  • 6.2 Hadoop平台监控
  • 6.3 平台维护
  • 6.4 小结
  • 第7章 Hadoop异常处理解决方案
  • 7.1 定位异常
  • 7.2 解决问题的方式
  • 7.3 实战案例分析
  • 7.4 小结
  • 第8章 初识Hadoop核心源码
  • 8.1 基础准备与源码编译
  • 8.2 初识Hadoop 2
  • 8.3 MapReduce框架剖析
  • 8.4 序列化
  • 8.5 小结
  • 第9章 Hadoop通信机制和内部协议
  • 9.1 Hadoop RPC概述
  • 9.2 Hadoop RPC的分析与使用
  • 9.3 通信协议
  • 9.4 小结
  • 第10章 Hadoop分布式文件系统剖析
  • 10.1 HDFS介绍
  • 10.2 HDFS架构剖析
  • 10.3 数据迁移实战
  • 10.4 小结
  • 第11章 ELK实战案例——游戏应用实时日志分析平台
  • 11.1 Logstash——实时日志采集、分析和传输
  • 11.2 Elasticsearch——分布式存储及搜索引擎
  • 11.3 Kibana——可视化管理系统
  • 11.4 实时日志分析平台案例
  • 11.5 小结
  • 第12章 Kafka实战案例——实时处理游戏用户数据
  • 12.1 应用概述
  • 12.2 项目的分析与设计
  • 12.3 项目的编码实践
  • 12.4 小结
  • 第13章 Hadoop拓展——Kafka剖析
  • 13.1 Kafka开发与维护
  • 13.2 运维监控
  • 13.3 Kafka源码分析
  • 13.4 小结
展开全部