作品简介

大数据、人工智能正在改变或颠覆各行各业,包括我们的生活。大数据、人工智能方面的人才已经供不应求,但作为人工智能的核心——机器学习,因涉及的知识和技能比较多,除了需要具备一定的数学基础、相关业务知识外,还要求有比较全面的技术储备,如操作系统、数据库、开发语言、数据分析工具、大数据计算平台等,无形中提高了机器学习的门槛。如何降低机器学习的门槛,让更多有志于机器学习、人工智能的人能更方便或顺畅地使用、驾驭机器学习?

希望你通过阅读本书,不但可以了解很多内容或代码,更可以亲自运行或调试这些代码,从而带来新的体验和收获!

作品目录

  • 前言
  • 第1章 了解机器学习
  • 1.1 机器学习的定义
  • 1.2 大数据与机器学习
  • 1.3 机器学习、人工智能及深度学习
  • 1.4 机器学习的基本任务
  • 1.5 如何选择合适算法
  • 1.6 Spark在机器学习方面的优势
  • 1.7 小结
  • 第2章 构建Spark机器学习系统
  • 2.1 机器学习系统架构
  • 2.2 启动集群
  • 2.3 加载数据
  • 2.4 探索数据
  • 2.5 数据预处理
  • 2.6 构建模型
  • 2.7 模型评估
  • 2.8 组装
  • 2.9 模型选择或调优
  • 2.10 保存模型
  • 2.11 小结
  • 第3章 ML Pipeline原理与实战
  • 3.1 Pipeline简介
  • 3.2 DataFrame
  • 3.3 Pipeline组件
  • 3.4 Pipeline原理
  • 3.5 Pipeline实例
  • 3.6 小结
  • 第4章 特征提取、转换和选择
  • 4.1 特征提取
  • 4.2 特征转换
  • 4.3 特征选择
  • 4.4 小结
  • 第5章 模型选择和优化
  • 5.1 模型选择
  • 5.2 交叉验证
  • 5.3 训练验证拆分法
  • 5.4 自定义模型选择
  • 5.5 小结
  • 第6章 Spark MLlib基础
  • 6.1 Spark MLlib简介
  • 6.2 Spark MLlib架构
  • 6.3 数据类型
  • 6.4 基础统计
  • 6.5 RDD、Dataframe和Dataset
  • 6.6 小结
  • 第7章 构建Spark ML推荐模型
  • 7.1 推荐模型简介
  • 7.2 数据加载
  • 7.3 数据探索
  • 7.4 训练模型
  • 7.5 组装
  • 7.6 评估模型
  • 7.7 模型优化
  • 7.8 小结
  • 第8章 构建Spark ML分类模型
  • 8.1 分类模型简介
  • 8.2 数据加载
  • 8.3 数据探索
  • 8.4 数据预处理
  • 8.5 组装
  • 8.6 模型优化
  • 8.7 小结
  • 第9章 构建Spark ML回归模型
  • 9.1 回归模型简介
  • 9.2 数据加载
  • 9.3 探索特征分布
  • 9.4 数据预处理
  • 9.5 组装
  • 9.6 模型优化
  • 9.7 小结
  • 第10章 构建Spark ML聚类模型
  • 10.1 K-means模型简介
  • 10.2 数据加载
  • 10.3 探索特征的相关性
  • 10.4 数据预处理
  • 10.5 组装
  • 10.6 模型优化
  • 10.7 小结
  • 第11章 PySpark决策树模型
  • 11.1 PySpark简介
  • 11.2 决策树简介
  • 11.3 数据加载
  • 11.4 数据探索
  • 11.5 数据预处理
  • 11.6 创建决策树模型
  • 11.7 训练模型进行预测
  • 11.8 模型优化
  • 11.9 脚本方式运行
  • 11.10 小结
  • 第12章 SparkR朴素贝叶斯模型
  • 12.1 SparkR简介
  • 12.2 获取数据
  • 12.3 朴素贝叶斯分类器
  • 12.4 小结
  • 第13章 使用Spark Streaming构建在线学习模型
  • 13.1 Spark Streaming简介
  • 13.2 Dstream操作
  • 13.3 Spark Streaming应用实例
  • 13.4 Spark Streaming在线学习实例
  • 13.5 小结
  • 第14章 TensorFlowOnSpark详解
  • 14.1 TensorFlow简介
  • 14.2 TensorFlow实现卷积神经网络
  • 14.3 TensorFlow实现循环神经网络
  • 14.4 分布式TensorFlow
  • 14.5 TensorFlowOnSpark架构
  • 14.6 TensorFlowOnSpark安装
  • 14.7 TensorFlowOnSpark实例
  • 14.8 小结
  • 附录A 线性代数
  • 附录B 概率统计
  • 附录C Scala基础
展开全部