作品简介

《机器学习实践指南:案例应用解析》是机器学习及数据分析领域不可多得的一本著作,也是为数不多的既有大量实践应用案例又包含算法理论剖析的著作,作者针对机器学习算法既抽象复杂又涉及多门数学学科的特点,力求理论联系实际,始终以算法应用为主线,由浅入深以全新的角度诠释机器学习。

全书分为准备篇、基础篇、统计分析实战篇和机器学习实战篇。准备篇介绍了机器学习的发展及应用前景以及常用科学计算平台,主要包括统计分析语言r、机器学习模块mlpy和neurolab、科学计算平台numpy、图像识别软件包opencv、网页分析beautifulsoup等软件的安装与配置。基础篇先对数学基础及其在机器学习领域的应用进行讲述,同时推荐配套学习的数学书籍,然后运用实例说明计算平台的使用,以python和r为实现语言,重点讲解了图像算法、信息隐藏、最小二乘法拟合、因子频率分析、欧氏距离等,告诉读者如何使用计算平台完成工程应用。最后,通过大量统计分析和机器学习案例提供实践指南,首先讲解回归分析、区间分布、数据图形化、分布趋势、正态分布、分布拟合等数据分析基础,然后讲解神经网络、统计算法、欧氏距离、余弦相似度、线性与非线性回归、数据拟合、线性滤波、图像识别、人脸辨识、网页分类等机器学习算法。此书可供算法工程师、it专业人员以及机器学习爱好者参考使用。

麦好,计算机专业工程硕士,目前从事智能计算与算法分析工作。先后就职于多家软件科技公司、电子科技公司,是中国青年海归协会和中国量化投资学会山西分会成员。实战经验丰富,擅长使用C、C++、Python、Perl、汇编等语言,参与过信息系统核心中间件的研发、海外社区插件及服务器脚本研发、垂直搜索引擎与文本分析系统的算法设计、通信系统的信息隐藏技术研发、视频服务与点播系统的研发、基于汇编的系统底层设计等,有十余年架构设计及算法设计经验,近期关注分布式计算、机器视觉、仿生智能、生物计算、商业智能。

作品目录

  • 机器学习实践指南:案例应用解析
  • 前言
  • 第一部分 准备篇
  • 第1章 机器学习发展及应用前景
  • 1.1 机器学习概述
  • 1.1.1 什么是机器学习
  • 1.1.2 机器学习的发展
  • 1.1.3 机器学习的未来
  • 1.2 机器学习应用前景
  • 1.2.1 数据分析与挖掘
  • 1.2.2 模式识别
  • 1.2.3 更广阔的领域
  • 1.3 小结
  • 第2章 科学计算平台
  • 2.1 科学计算软件平台概述
  • 2.1.1 常用的科学计算软件
  • 2.1.2 本书使用的工程计算平台
  • 2.2 计算平台的配置
  • 2.2.1 Numpy等Python科学计算包的安装与配置
  • 2.2.2 OpenCV安装与配置
  • 2.2.3 mlpy安装与配置
  • 2.2.4 BeautifulSoup安装与配置
  • 2.2.5 Neurolab安装与配置
  • 2.2.6 R安装与配置
  • 2.3 小结
  • 第二部分 基础篇
  • 第3章 机器学习数学基础
  • 3.1 数学对我们有用吗
  • 3.2 机器学习需要哪些数学知识
  • 3.3 小结
  • 第4章 计算平台应用实例
  • 4.1 Python计算平台简介及应用实例
  • 4.1.1 Python语言基础
  • 4.1.2 Numpy库
  • 4.1.3 pylab、matplotlib绘图
  • 4.1.4 图像基础
  • 4.1.5 图像融合与图像镜像
  • 4.1.6 图像灰度化与图像加噪
  • 4.1.7 声音基础
  • 4.1.8 声音音量调节
  • 4.1.9 图像信息隐藏
  • 4.1.10 声音信息隐藏
  • 4.2 R语言基础
  • 4.2.1 基本操作
  • 4.2.2 向量
  • 4.2.3 对象集属性
  • 4.2.4 因子和有序因子
  • 4.2.5 循环语句
  • 4.2.6 条件语句
  • 4.3 R语言科学计算
  • 4.3.1 分类(组)统计
  • 4.3.2 数组与矩阵基础
  • 4.3.3 数组运算
  • 4.3.4 矩阵运算
  • 4.4 R语言计算实例
  • 4.4.1 学生数据集读写
  • 4.4.2 最小二乘法拟合
  • 4.4.3 交叉因子频率分析
  • 4.4.4 向量模长计算
  • 4.4.5 欧氏距离计算
  • 4.5 小结
  • 思考题
  • 第三部分 统计分析实战篇
  • 第5章 统计分析基础
  • 5.1 数据分析概述
  • 5.2 数学基础
  • 5.3 回归分析
  • 5.3.1 单变量线性回归
  • 5.3.2 多元线性回归
  • 5.3.3 非线性回归
  • 5.4 数据分析基础
  • 5.4.1 区间频率分布
  • 5.4.2 数据直方图
  • 5.4.3 数据散点图
  • 5.4.4 五分位数
  • 5.4.5 累积分布函数
  • 5.4.6 核密度估计
  • 5.5 数据分布分析
  • 5.6 小结
  • 思考题
  • 第6章 统计分析案例
  • 6.1 数据图形化案例解析
  • 6.1.1 点图
  • 6.1.2 饼图和条形图
  • 6.1.3 茎叶图和箱线图
  • 6.2 数据分布趋势案例解析
  • 6.2.1 平均值
  • 6.2.2 加权平均值
  • 6.2.3 数据排序
  • 6.2.4 中位数
  • 6.2.5 极差、半极差
  • 6.2.6 方差
  • 6.2.7 标准差
  • 6.2.8 变异系数、样本平方和
  • 6.2.9 偏度系数、峰度系数
  • 6.3 正态分布案例解析
  • 6.3.1 正态分布函数
  • 6.3.2 峰度系数分析
  • 6.3.3 累积分布概率
  • 6.3.4 概率密度函数
  • 6.3.5 分位点
  • 6.3.6 频率直方图
  • 6.3.7 核概率密度与正态概率分布图
  • 6.3.8 正太检验与分布拟合
  • 6.3.9 其他分布及其拟合
  • 6.4 小结
  • 思考题
  • 第四部分 机器学习实战篇
  • 第7章 机器学习算法
  • 7.1 神经网络
  • 7.1.1 Rosenblatt感知器
  • 7.1.2 梯度下降
  • 7.1.3 反向传播与多层感知器
  • 7.1.4 Python神经网络库
  • 7.2 统计算法
  • 7.2.1 平均值
  • 7.2.2 方差与标准差
  • 7.2.3 贝叶斯算法
  • 7.3 欧氏距离
  • 7.4 余弦相似度
  • 7.5 SVM
  • 7.5.1 数学原理
  • 7.5.2 SMO算法
  • 7.5.3 算法应用
  • 7.6 回归算法
  • 7.6.1 线性代数基础
  • 7.6.2 最小二乘法原理
  • 7.6.3 线性回归
  • 7.6.4 多元非线性回归
  • 7.6.5 岭回归方法
  • 7.6.6 伪逆方法
  • 7.7 PCA降维
  • 7.8 小结
  • 思考题
  • 第8章 数据拟合案例
  • 8.1 数据拟合
  • 8.1.1 图像分析法
  • 8.1.2 神经网络拟合法
  • 8.2 线性滤波
  • 8.2.1 WAV声音文件
  • 8.2.2 线性滤波算法过程
  • 8.2.3 滤波Python实现
  • 8.3 小结
  • 思考题
  • 第9章 图像识别案例
  • 9.1 图像边缘算法
  • 9.1.1 数字图像基础
  • 9.1.2 算法描述
  • 9.2 图像匹配
  • 9.2.1 差分矩阵求和
  • 9.2.2 差分矩阵均值
  • 9.2.3 欧氏距离匹配
  • 9.3 图像分类
  • 9.3.1 余弦相似度
  • 9.3.2 PCA图像特征提取算法
  • 9.3.3 基于神经网络的图像分类
  • 9.3.4 基于SVM的图像分类
  • 9.4 人脸辨识
  • 9.4.1 人脸定位
  • 9.4.2 人脸辨识
  • 9.5 手写数字识别
  • 9.5.1 手写数字识别算法
  • 9.5.2 算法的Python实现
  • 9.6 小结
  • 思考题
  • 第10章 文本分类案例
  • 10.1 文本分类概述
  • 10.2 余弦相似度分类
  • 10.2.1 中文分词
  • 10.2.2 停用词清理
  • 10.2.3 算法实战
  • 10.3 朴素贝叶斯分类
  • 10.3.1 算法描述
  • 10.3.2 先验概率计算
  • 10.3.3 最大后验概率
  • 10.3.4 算法实现
  • 10.4 小结
  • 思考题
  • 彩图部分
展开全部