作品简介

大数据贵在落实!本书是一本讲解大数据实战的图书,按照“深入分析组件原理、充分展示搭建过程、详细指导应用开发”的指导思想编写。全书分为三篇,第一篇为大数据的基本概念和技术,主要介绍大数据的背景、概念、特性及关键技术;第二篇为Hadoop大数据平台搭建与基本应用,内容涉及Linux、HDFS、MapReduce、Yarn、Hive、HBase、Sqoop、Kafka、Spark等;第三篇为大数据处理与项目开发,包括交互式数据处理、协同过滤推荐系统、销售数据分析系统,并就京东的部分销售数据使用大数据进行处理分析。本书适合初学者入门和进阶,也可供希望全面、系统地理解并掌握大数据实际应用的读者参考,对从事大数据项目开发的专业人员也有参考价值。

黄东军,男,教授,博士,博士生导师。毕业于中南大学计算机应用技术,先工作于中南大学信息科学与工程学院。中国计算机学会高级会员,教育部计算机科学与技术专业教学指导委员会"物联网工程专业教学研究专家组”成员。

作品目录

  • 内容简介
  • 第2版前言
  • 第1版前言
  • 第一篇 大数据的基本概念和技术
  • 第1章 绪论
  • 1.1 大数据的时代背景
  • 1.2 大数据的基本概念和特征
  • 1.3 大数据系统的技术支撑体系
  • 1.4 大数据领域的主要职位及其能力要求
  • 1.5 本章小结
  • 第2章 Hadoop大数据关键技术
  • 2.1 Hadoop大数据应用生态系统
  • 2.2 大数据采集技术
  • 2.3 大数据存储技术
  • 2.4 分布式计算框架
  • 2.5 数据分析平台与工具
  • 2.6 本章小结
  • 第二篇 Hadoop大数据平台搭建与基本应用
  • 第3章 Linux操作系统与集群搭建
  • 3.1 Linux操作系统
  • 3.2 Linux集群的搭建
  • 3.3 集群的配置
  • 3.4 Linux基本命令
  • 3.5 本章小结
  • 第4章 HDFS安装与基本应用
  • 4.1 HDFS概述
  • 4.2 HDFS架构分析
  • 4.3 文件操作过程分析
  • 4.4 Hadoop的安装与配置
  • 4.5 Hadoop集群的启动
  • 4.6 Hadoop集群的基本应用
  • 4.7 本章小结
  • 第5章 MapReduce与Yarn
  • 5.1 MapReduce程序的概念
  • 5.2 深入理解Yarn
  • 5.3 在Linux平台安装Eclipse
  • 5.4 开发MapReduce程序的基本方法
  • 5.5 本章小结
  • 第6章 Hive和HBase的安装与应用
  • 6.1 在CentOS 7下安装MySQL
  • 6.2 Hive安装与应用
  • 6.3 ZooKeeper集群安装
  • 6.4 HBase的安装与应用
  • 6.5 本章小结
  • 第7章 Sqoop和Kafka的安装与应用
  • 7.1 安装部署Sqoop
  • 7.2 安装部署Kafka集群
  • 7.3 本章小结
  • 第8章 Spark集群的安装与开发环境的配置
  • 8.1 深入理解Spark
  • 8.2 Scala的安装与配置
  • 8.3 Spark集群的安装与配置
  • 8.4 IDEA开发环境的安装与配置
  • 8.5 本章小结
  • 第9章 Spark应用基础
  • 9.1 Spark应用程序的运行模式
  • 9.2 Spark的应用设计
  • 9.3 本章小结
  • 第三篇 大数据处理与项目开发
  • 第10章 交互式数据处理
  • 10.1 数据预处理
  • 10.2 创建数据仓库
  • 10.3 数据分析
  • 10.4 本章小结
  • 第11章 协同过滤推荐系统
  • 11.1 推荐算法概述
  • 11.2 协同过滤推荐算法分析
  • 11.3 Spark MLlib推荐算法应用
  • 11.4 本章小结
  • 第12章 销售数据分析系统
  • 12.1 数据采集
  • 12.2 在HBase集群上准备数据
  • 12.3 安装Phoenix中间件
  • 12.4 基于Web的前端开发
  • 12.5 本章小结
  • 参考文献
展开全部