作品简介

大数据贵在落实!本书是一本讲解大数据实战的图书,按照“深入分析组件原理、充分展示搭建过程、详细指导应用开发”编写。全书分为三篇,第一篇为大数据的基本概念和技术,主要介绍大数据的背景、发展及关键技术;第二篇为Hadoop大数据平台搭建与基本应用,内容涉及Linux、HDFS、MapReduce、YARN、Hive、HBase、Sqoop、Kafk、Spark等;第三篇为大数据处理与项目开发,包括交互式数据处理、协同过滤推荐系统、销售数据分析系统,部分销售数据应用大数据进行处理分析。

黄东军,男,教授,博士,博士生导师。毕业于中南大学计算机应用技术,先工作于中南大学信息科学与工程学院。中国计算机学会高级会员,教育部计算机科学与技术专业教学指导委员会"物联网工程专业教学研究专家组”成员。

作品目录

  • 前言
  • 第一篇 大数据的基本概念和技术
  • 第1章 绪论
  • 第二篇 Hadoop大数据平台搭建与基本应用
  • 第2章 Hadoop大数据关键技术
  • 第三篇 数据处理与项目开发
  • 第3章 Linux操作系统与集群搭建
  • 第4章 HDFS安装与基本应用
  • 第5章 MapReduce与Yarn
  • 第6章 Hive和HBase的安装与应用
  • 第7章 Sqoop和Kafka的安装与应用
  • 第8章 Spark集群安装与开发环境配置
  • 第9章 Spark应用基础
  • 第10章 交互式数据处理
  • 第11章 协同过滤推荐系统
  • 第12章 销售数据分析系统
展开全部