作品简介

本书一共分为19章,1~7章是编程基础,为了让那些没有编程经验的但是又想从事数据分析工作的学员有个入门的基础。8~19章则介绍了机器学习领域中常用的算法,他们分别是线性回归,逻辑回归,神经网络,线性判别,最近邻算法,决策树与随机森林,朴素贝叶斯,支持向量机,主成分分析,奇异值分解,k-means聚类。在第19章中则着重介绍了现在比较流行的深度学习框架。

王新宇

上海大学副教授,主讲机器学习课程,研究方向包括金融行业大数据挖掘、医学行业大数据挖掘、图像识别以及高性能计算。

作品目录

  • 内容提要
  • 前言
  • 第1章 环境配置与准备知识
  • 1.1 环境配置
  • 1.2 机器学习相关概念
  • 第2章 Python基础知识
  • 2.1 hello world!
  • 2.2 变量
  • 2.3 操作符
  • 2.4 字符串
  • 2.5 列表
  • 2.6 集合
  • 2.7 字典
  • 2.8 循环语句
  • 2.9 判断语句
  • 2.10 函数
  • 2.11 面向对象编程
  • 第3章 数值计算扩展工具——Numpy
  • 3.1 创建数组
  • 3.2 数组索引
  • 3.3 排序与查询
  • 3.4 随机数生成器
  • 3.5 数学函数
  • 3.6 统计函数
  • 3.7 线性代数
  • 第4章 数据分析工具——Pandas
  • 4.1 序列对象Series
  • 4.2 数据框对象DataFrame
  • 4.3 分组对象GroupBy
  • 第5章 可视化展示库——Matplotlib
  • 5.1 作图类命令
  • 5.2 坐标轴控制
  • 5.3 其他设置
  • 第6章 通用型开源机器学习库——Scikit
  • 6.1 预处理
  • 6.2 降维
  • 6.3 有监督学习与无监督学习
  • 6.4 模型评估
  • 第7章 机器学习常用数据集
  • 7.1 boston房价数据集
  • 7.2 diabetes糖尿病数据集
  • 7.3 digits手写字体识别数据集
  • 7.4 iris鸢尾花数据集
  • 7.5 wine红酒数据集
  • 第8章 线性回归算法
  • 8.1 从二次函数到机器学习
  • 8.2 深入理解线性回归算法
  • 8.3 线性回归算法实战——糖尿病患者病情预测
  • 第9章 逻辑回归算法
  • 9.1 逻辑回归算法的基础知识
  • 9.2 深入理解逻辑回归算法
  • 9.3 逻辑回归算法实战——二维鸢尾花分类
  • 第10章 神经网络算法
  • 10.1 神经网络算法的基础知识
  • 10.2 深入理解神经网络算法
  • 10.3 神经网络的应用
  • 第11章 线性判别算法
  • 11.1 线性判别算法的核心知识
  • 11.2 线性判别算法详解
  • 11.3 线性判别算法实战——花卉分类
  • 第12章 K最近邻算法
  • 12.1 K最近邻算法的核心知识
  • 12.2 K最近邻算法详解
  • 12.3 K最近邻算法实战——手写字体识别
  • 第13章 决策树方法与随机森林
  • 13.1 决策树方法的基本知识
  • 13.2 决策树方法的原理
  • 13.3 决策树方法实战——红酒分类
  • 13.4 随机森林
  • 第14章 贝叶斯算法
  • 14.1 贝叶斯算法的基础知识
  • 14.2 深入理解贝叶斯算法
  • 14.3 贝叶斯算法实战——文本分类
  • 第15章 支持向量机
  • 15.1 支持向量机的基础知识
  • 15.2 深入理解支持向量机
  • 15.3 支持向量机实战——鸢尾花分类
  • 第16章 PCA降维算法
  • 16.1 PCA降维算法的核心知识
  • 16.2 PCA降维算法详解
  • 16.3 PCA降维算法实战——iris数据集可视化
  • 第17章 SVD奇异值分解
  • 17.1 SVD奇异值分解的相关知识
  • 17.2 深入理解矩阵作用
  • 17.3 SVD奇异值分解的应用
  • 第18章 聚类算法
  • 18.1 深入理解K均值聚类算法
  • 18.2 Scikit库中的K均值聚类算法
  • 18.3 其他聚类算法
  • 第19章 深度学习框架及其应用
  • 19.1 TensorFlow
  • 19.2 Keras
  • 19.3 PyTorch
  • 19.4 Caffe
展开全部