大数据技术全解电子书免费在线阅读,免费在线试读,作者：杨巨龙

书名
大数据技术全解
基础、设计、开发与实践
作者杨巨龙
出版社电子工业出版社 / 2014-03
ISBN书号9787121223433
字数约 157,000 字
全本定价￥8.82

作品简介

“大数据”一词已成为当下最热门的词汇之一。人们热切期待大数据能给工作、学习和生活等方面带来前所未有的变化，而大数据的采集、存储、计算、分析挖掘、呈现和安全等技术正是实现这一变化的关键。《大数据技术全解：基础、设计、开发与实践》的重点不在于对大数据技术的原理性介绍，而是从实战角度出发，系统地阐述如何基于Hadoop开源软件为客户设计、安装和开发一个大数据系统。《大数据技术全解：基础、设计、开发与实践》还着重分享了具体实践中的一些案例，不仅对于从事大数据系统开发的IT技术人员具有珍贵的参考价值，而且对准备实施大数据系统项目的企业级客户也具有指导作用。

《大数据技术全解：基础、设计、开发与实践》可以作为计算机软件专业的本科生和研究生的大数据技术教材，也可作为大数据技术开发培训、大数据系统咨询规划培训的教材，更是大数据领域内一线的需求分析人员、系统分析人员、高级开发人员和开发管理人员的必备参考书。

作品目录

序1
序2
前言
第1篇基础篇
第1章大数据的三把利剑
1.1 豌豆杂交实验
1.2 曹冲称象启示
1.3 谷歌的三把利剑
1.4 智慧改变世界
第2章企业的大数据观
2.1 企业面临的挑战
2.2 企业大数据从哪来
2.3 企业大数据如何存储
2.4 企业大数据如何加工
2.5 企业的大数据到哪里去
2.6 企业大数据观总结
第3章大数据和大数据系统
3.1 大数据
3.2 大数据系统
第2篇技术篇
第4章分布、键值对与族
4.1 分布与MapReduce
4.2 键值对的奥妙所在
4.3 动态数据库表原理
第5章 HDFS（分布式文件系统）
5.1 设计目标
5.2 基本概念
5.3 系统架构
5.4 运行机制
5.5 系统功能
5.6 系统I/O特性
5.7 非Java访问接口
5.8 系统性能
第6章 MapReduce分布式编程模式
6.1 不同于传统
6.2 设计思想
6.3 基本概念
6.4 系统架构
6.5 运行机制
6.6 关键技术
6.7 类型与格式
6.8 MR的开发
6.9 MR工作流
第7章 HBase分布式数据库
7.1 设计目标
7.2 基本概念
7.3 系统架构
7.4 运行机制
7.5 系统功能
7.6 库表设计
7.7 访问接口
第3篇设计篇
第8章系统设计背景和目标
8.1 系统设计背景
8.2 系统设计目标
第9章系统架构设计
9.1 逻辑架构设计
9.2 功能架构设计
9.3 数据架构设计
第10章运行架构设计
10.1 物理架构设计
10.2 集成架构设计
10.3 安全架构设计
10.4 开发架构设计
第4篇安装篇
第11章安装规划
11.1 安装目标
11.2 安装步骤
第12章环境准备
12.1 主机准备
12.2 介质准备
12.3 基础安装
第13章集群安装
13.1 HDFS集群
13.2 HBase集群
13.3 ZooKeeper集群
第14章分布式应用安装
14.1 Pig安装
14.2 Hive安装
14.3 Chukwa安装
第15章集成联调
15.1 集群间的集成联调
15.2 分布式应用与集群间的集成联调
15.3 客户端与分布式系统间的集成联调
第5篇开发篇
第16章大数据系统应用开发思路和环境
16.1 总体思路
16.2 开发环境
第17章 HDFS文件读/写应用开发
17.1 文件列表
17.2 文件读取
17.3 文件上传
17.4 文件创建
17.5 文件写入
17.6 文件压缩与解压
17.7 目录创建
17.8 文件重命名
17.9 删除文件
17.10 查看文件时间
17.11 查看文件是否存在
17.12 查找文件位置
17.13 查找集群所有的节点
17.14 SequenceFile文件格式转换
17.15 MapFile文件格式转换
第18章 HBase数据库读/写应用开发
18.1 创建表
18.2 删除表
18.3 查询数据库中的表
18.4 插入记录
18.5 查询记录
18.6 修改记录
18.7 删除记录
第19章 ZooKeeper开发
19.1 创建节点
19.2 删除节点
19.3 加入子节点
19.4 列出节点成员
19.5 获取节点内容
第20章 MapReduce开发
20.1 定制数据类型
20.2 定制输入格式
20.3 定制输出格式
20.4 将整个文件作为输入
20.5 小文件聚合成一个文件
20.6 多集合文件输出
20.7 对压缩数据处理
20.8 定制partioner
20.9 定制combiner
20.10 MapReduce组合
20.11 多数据源连接
20.12 全局参数应用
20.13 全局文件应用
20.14 关系数据库访问
第21章 Pig开发
21.1 脚本编程
21.2 自定义函数
第22章 Hive开发
22.1 HiveQL语言
22.2 UDF编码
22.3 UDAF编码
22.4 客户端编码
第6篇实践篇
第23章企业大数据盘系统
23.1 系统开发背景
23.2 系统架构设计
23.3 系统功能设计
23.4 系统代码实现
第24章 Hadoop的日志分析
24.1 系统开发背景
24.2 系统架构设计
24.3 系统功能设计
24.4 系统代码实现
24.5 系统实现效果
参考文献

展开全部