作品简介

本书以透彻的原理分析和充实的实例代码详解,全面阐述了Spark Streaming流式处理平台的相关知识,能够让读者快速掌握如何搭建Spark平台,然后在此基础上学习流式处理框架,并动手实践进行Spark Streaming流式应用的开发,包括与主流平台框架的对接应用,以及项目实战中的一些开发和调优策略等。本书共10章,分为3篇。第1篇为Spark基础,主要阐述了Spark的基本原理、平台搭建及实例应用;第2篇为Spark Streaming详解,阐述了Spark Streaming的基本原理,并重点介绍了Spark Streaming与Kafka、ZooKeeper、MySQL、HBase和Redis的配合使用、相关调优策略及实际应用;第3篇为Spark Streaming案例实战,主要介绍了实时词频统计处理、用户行为统计和监控报警系统3个实战案例,帮助读者进行实战演练,提升读者的实际项目开发水平。另外,本书附录还对Scala语言基础做了简要讲解。本书内容理论结合实战,特别适合大数据技术爱好者及相关从业人员阅读,也可作为他们的常备工具书使用。另外,本书也适合作为大数据培训机构及高校相关专业的教材使用。

肖力涛编著

作品目录

  • 前言
  • 第1篇 Spark基础
  • 第1章 初识Spark
  • 第2章 Spark运行与开发环境
  • 第3章 Spark编程模型
  • 第2篇 Spark Streaming详解
  • 第4章 Spark Streaming编程模型及原理
  • 第5章 Spark Streaming与Kafka
  • 第6章 Spark Streaming与外部存储介质
  • 第7章 Spark Streaming调优实践
  • 第3篇 Spark Streaming案例实战
  • 第8章 实时词频统计处理系统实战
  • 第9章 用户行为统计实战
  • 第10章 监控报警系统实战
  • 附录A Scala语言基础
展开全部