作品简介
本书是一本讲解Spark基础应用及编程的实用教程,基于Spark 2.3版本,内容包括Spark与大数据、构建Spark运行环境、开发第一个Spark程序、深入理解Spark程序代码、RDD编程、Spark SQL结构化数据处理、Spark Streaming、Structured Streaming、SparkR和GraphX。
本书配以大量的示例、源代码和注释,可以帮助读者快速、全面而又深入地掌握Spark编程技能。
本书既可作为高等院校大数据、云计算和人工智能相关专业的教材,也可以作为Spark学习者和大数据研发人员的技术参考书。
文艾(艾叔):系统分析师,原解放军理工大学-奇虎360联合实验室技术负责人;具有多年大数据开发和运维经验,带领团队完成了与华为、中兴通讯和奇虎360等公司合作的多个大数据类项目;曾受邀为中兴通讯和奇虎360等公司做技术培训,其主讲的Spark课程长期排名51,CTO学院大数据类Spark分类年销量第一;擅长帮助初学者快速掌握Spark大数据编程技能,近年来指导零基础本科生参加Spark类全国编程竞赛,战胜了多支985高校的研究生队,获得全国总决赛二等奖两次和三等奖一次;指导本科生完成的云计算和大数据类作品,参加国家级科技创新竞赛,共获得全国特等奖一次,一等奖两次;通过“艾叔编程"公众号,以及网易云课堂上开设的一系列免费视频课程,至今已帮助8万多名学习者入门大数据编程,并深受好评。
