作品简介

本书是一本讲解Spark基础应用及编程的实用教程,基于Spark 2.3版本,内容包括Spark与大数据、构建Spark运行环境、开发第一个Spark程序、深入理解Spark程序代码、RDD编程、Spark SQL结构化数据处理、Spark Streaming、Structured Streaming、SparkR和GraphX。

本书配以大量的示例、源代码和注释,可以帮助读者快速、全面而又深入地掌握Spark编程技能。

本书既可作为高等院校大数据、云计算和人工智能相关专业的教材,也可以作为Spark学习者和大数据研发人员的技术参考书。

文艾(艾叔):系统分析师,原解放军理工大学-奇虎360联合实验室技术负责人;具有多年大数据开发和运维经验,带领团队完成了与华为、中兴通讯和奇虎360等公司合作的多个大数据类项目;曾受邀为中兴通讯和奇虎360等公司做技术培训,其主讲的Spark课程长期排名51,CTO学院大数据类Spark分类年销量第一;擅长帮助初学者快速掌握Spark大数据编程技能,近年来指导零基础本科生参加Spark类全国编程竞赛,战胜了多支985高校的研究生队,获得全国总决赛二等奖两次和三等奖一次;指导本科生完成的云计算和大数据类作品,参加国家级科技创新竞赛,共获得全国特等奖一次,一等奖两次;通过“艾叔编程"公众号,以及网易云课堂上开设的一系列免费视频课程,至今已帮助8万多名学习者入门大数据编程,并深受好评。

作品目录

  • 前言
  • 第1章 Spark与大数据
  • 第2章 构建Spark运行环境
  • 第3章 开发第一个Spark程序
  • 第4章 深入理解Spark程序代码
  • 第5章 RDD编程
  • 第6章 Spark SQL结构化数据处理
  • 第7章 Spark Streaming
  • 第8章 Structured Streaming
  • 第9章 SparkR
  • 第10章 GraphX
  • 参考文献
展开全部