作品简介

本书主要介绍:XGBoost相关的机器学习基础算法;XGBoost安装编译与简单使用;XGBoost的实现原理与理论证明;XGBoost基于CPU多线程的实现以及分布式训练方法;剖析XGBoost源码,从代码层面洞彻XGBoost的实现原理,以及XGBoost的应用与调优,通过典型示例为读者提供使用参考,掌握实战技能。通过阅读本书,不仅能使读者理解XGBoost的原理,将XGBoost应用到业务场景中,更能从源码的角度深入学习XGBoost的并行化和分布式实现等优化技术,以更短的时间训练出高准确度的模型,使XGBoost成为学习和工作中的一把利剑。

何龙编著

作品目录

  • 前言
  • 第1章 机器学习概述
  • 1.1 何谓机器学习
  • 1.2 集成学习发展与XGBoost提出
  • 1.3 小结
  • 第2章 XGBoost骊珠初探
  • 2.1 搭建Python机器学习环境
  • 2.2 搭建XGBoost运行环境
  • 2.3 示例:XGBoost告诉你蘑菇是否有毒
  • 2.4 小结
  • 第3章 机器学习算法基础
  • 3.1 KNN
  • 3.2 线性回归
  • 3.3 逻辑回归
  • 3.4 决策树
  • 3.5 正则化
  • 3.6 排序
  • 3.7 人工神经网络
  • 3.8 支持向量机
  • 3.9 小结
  • 第4章 XGBoost小试牛刀
  • 4.1 XGBoost实现原理
  • 4.2 二分类问题
  • 4.3 多分类问题
  • 4.4 回归问题
  • 4.5 排序问题
  • 4.6 其他常用功能
  • 4.7 小结
  • 第5章 XGBoost原理与理论证明
  • 5.1 CART
  • 5.2 Boosting算法思想与实现
  • 5.3 XGBoost中的Tree Boosting
  • 5.4 切分点查找算法
  • 5.5 排序学习
  • 5.6 DART
  • 5.7 树模型的可解释性
  • 5.8 线性模型原理
  • 5.9 系统优化
  • 5.10 小结
  • 第6章 分布式XGBoost
  • 6.1 分布式机器学习框架Rabit
  • 6.2 资源管理系统YARN
  • 6.3 可移植分布式XGBoost4J
  • 6.4 基于Spark平台的实现
  • 6.5 基于Flink平台的实现
  • 6.6 基于GPU加速的实现
  • 6.7 小结
  • 第7章 XGBoost进阶
  • 7.1 模型训练、预测及解析
  • 7.2 树模型更新
  • 7.3 目标函数
  • 7.4 评估函数
  • 7.5 小结
  • 第8章 模型选择与优化
  • 8.1 偏差与方差
  • 8.2 模型选择
  • 8.3 超参数优化
  • 8.4 XGBoost超参数优化
  • 8.5 小结
  • 第9章 通过XGBoost实现广告分类器
  • 9.1 PCA
  • 9.2 通过XGBoost实现广告分类器
  • 9.3 小结
  • 第10章 基于树模型的其他研究与应用
  • 10.1 GBDT、LR融合提升广告点击率
  • 10.2 mGBDT
  • 10.3 DEF
  • 10.4 一种基于树模型的强化学习方法
  • 10.5 小结
展开全部