Hadoop大数据实战权威指南（第2版）电子书免费在线阅读,免费在线试读,作者：黄东军

书名
Hadoop大数据实战权威指南（第2版）
大数据科学与应用丛书
作者黄东军
出版社电子工业出版社 / 2019-08
ISBN书号9787121370335
字数约 147,000 字
全本定价￥39.50

作品简介

大数据贵在落实！本书是一本讲解大数据实战的图书，按照“深入分析组件原理、充分展示搭建过程、详细指导应用开发”的指导思想编写。全书分为三篇，第一篇为大数据的基本概念和技术，主要介绍大数据的背景、概念、特性及关键技术；第二篇为Hadoop大数据平台搭建与基本应用，内容涉及Linux、HDFS、MapReduce、Yarn、Hive、HBase、Sqoop、Kafka、Spark等；第三篇为大数据处理与项目开发，包括交互式数据处理、协同过滤推荐系统、销售数据分析系统，并就京东的部分销售数据使用大数据进行处理分析。本书适合初学者入门和进阶，也可供希望全面、系统地理解并掌握大数据实际应用的读者参考，对从事大数据项目开发的专业人员也有参考价值。

黄东军，男，教授，博士，博士生导师。毕业于中南大学计算机应用技术，先工作于中南大学信息科学与工程学院。中国计算机学会高级会员，教育部计算机科学与技术专业教学指导委员会"物联网工程专业教学研究专家组”成员。

作品目录

内容简介
第2版前言
第1版前言
第一篇大数据的基本概念和技术
第1章绪论
1.1 大数据的时代背景
1.2 大数据的基本概念和特征
1.3 大数据系统的技术支撑体系
1.4 大数据领域的主要职位及其能力要求
1.5 本章小结
第2章 Hadoop大数据关键技术
2.1 Hadoop大数据应用生态系统
2.2 大数据采集技术
2.3 大数据存储技术
2.4 分布式计算框架
2.5 数据分析平台与工具
2.6 本章小结
第二篇 Hadoop大数据平台搭建与基本应用
第3章 Linux操作系统与集群搭建
3.1 Linux操作系统
3.2 Linux集群的搭建
3.3 集群的配置
3.4 Linux基本命令
3.5 本章小结
第4章 HDFS安装与基本应用
4.1 HDFS概述
4.2 HDFS架构分析
4.3 文件操作过程分析
4.4 Hadoop的安装与配置
4.5 Hadoop集群的启动
4.6 Hadoop集群的基本应用
4.7 本章小结
第5章 MapReduce与Yarn
5.1 MapReduce程序的概念
5.2 深入理解Yarn
5.3 在Linux平台安装Eclipse
5.4 开发MapReduce程序的基本方法
5.5 本章小结
第6章 Hive和HBase的安装与应用
6.1 在CentOS 7下安装MySQL
6.2 Hive安装与应用
6.3 ZooKeeper集群安装
6.4 HBase的安装与应用
6.5 本章小结
第7章 Sqoop和Kafka的安装与应用
7.1 安装部署Sqoop
7.2 安装部署Kafka集群
7.3 本章小结
第8章 Spark集群的安装与开发环境的配置
8.1 深入理解Spark
8.2 Scala的安装与配置
8.3 Spark集群的安装与配置
8.4 IDEA开发环境的安装与配置
8.5 本章小结
第9章 Spark应用基础
9.1 Spark应用程序的运行模式
9.2 Spark的应用设计
9.3 本章小结
第三篇大数据处理与项目开发
第10章交互式数据处理
10.1 数据预处理
10.2 创建数据仓库
10.3 数据分析
10.4 本章小结
第11章协同过滤推荐系统
11.1 推荐算法概述
11.2 协同过滤推荐算法分析
11.3 Spark MLlib推荐算法应用
11.4 本章小结
第12章销售数据分析系统
12.1 数据采集
12.2 在HBase集群上准备数据
12.3 安装Phoenix中间件
12.4 基于Web的前端开发
12.5 本章小结
参考文献

展开全部