作品简介

本书共分为12章,第1章介绍了大数据产生的背景、大数据的结构与特征、大数据相关概念、大数据可视化、大数据相关工具与发展前景。第2~9章为基础知识部分,介绍了大数据的生态系统全貌,重点对计算平台Hadoop、分布式文件系统HDFS、计算框架MapReduce、开源数据库HBase、典型工具NoSQL、集群计算Spark、流计算Storm和分布式协调系统Zookeeper等相关技术进行了详细介绍,通过实例使读者具备解决实际问题的能力。第10~12章为典型应用案例部分,介绍了大数据分析应用系统的开发过程,涵盖了数据采集、数据分析、数据转换和结果显示的整个交互式大数据处理和分析流程。

本书内容丰富、条理清晰、示例指导性强,读者可以通过章后的习题对所学内容作进一步巩固,熟练掌握大数据基本原理、工程应用场景及实验分析技巧。

本书适合作为大中专院校数据科学与大数据专业、计算机类专业的教材,也可以作为读者自学或者科研技术人员的参考书。

赵国生,王健,宋一兵 主编

作品目录

  • 前言
  • 第1章 初识大数据
  • 第2章 大数据处理架构Hadoop
  • 第3章 分布式文件系统HDFS
  • 第4章 计算系统MapReduce
  • 第5章 分布式数据库HBase
  • 第6章 NoSQL数据库
  • 第7章 集群计算Spark
  • 第8章 流计算Storm
  • 第9章 分布式协调系统ZooKeeper
  • 第10章 销售数据分析系统
  • 第11章 交互式数据处理
  • 第12章 协同过滤推荐系统
  • 附录 课后习题答案
  • 参考文献
展开全部