作品简介

本书以Hadoop3.x及其周边框架为主线,介绍了整个Hadoop生态系统主流的大数据开发技术。全书共16章,第1章讲解VMware中CentOS7操作系统的安装;第2章讲解操作系统集群环境的配置;第3~16章讲解Hadoop生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和数据实时处理系统Flume、Kafka、Storm、Spark以及分布式搜索系统Elasticsearch等的基础知识、架构原理、集群环境搭建,同时包括常用的Shell命令、API操作、源码剖析,并通过案例演示了各个框架的实际应用。读者即使没有任何大数据基础,通过阅读本书,也可以对照书中的步骤成功搭建属于自己的大数据集群并独立完成项目开发。

本书通俗易懂,内容丰富,适合大数据开发初学者、大数据运维人员以及大数据分析与挖掘的从业者阅读,也可作为培训机构和大专院校大数据专业课程的教学用书。

张伟洋,大数据领域资深专家,拥有多年互联网公司软件研发经验,曾在互联网旅游公司任软件研发事业部经理。先后多次为中国海洋大学、曲阜师范大学、青岛理工大学等高校举行大数据专题讲座,对Hadoop及周边大数据框架ZooKeeper、Hive、HBase、Storm、Spark、Flink等有深入的研究。已出版《Flink大数据分析实战》《Spark大数据分析实战》等图书,公众号“奋斗在IT”的创办人。

作品目录

  • 内容简介
  • 作者简介
  • 前言
  • 第1章 VMware中安装CentOS
  • 第2章 CentOS7集群环境配置
  • 第3章 Hadoop
  • 第4章 HDFS
  • 第5章 MapReduce
  • 第6章 ZooKeeper
  • 第7章 HDFS与YARNHA
  • 第8章 HBase
  • 第9章 Hive
  • 第10章 Sqoop
  • 第11章 Kafka
  • 第12章 Flume
  • 第13章 Storm
  • 第14章 Elasticsearch
  • 第15章 Scala
  • 第16章 Spark
展开全部