作品简介

本书介绍了数据科学领域常用的所有重要机器学习算法以及TensorFlow和特征工程等相关内容。涵盖的算法包括线性回归、逻辑回归、支持向量机、朴素贝叶斯、k均值、随机森林等,这些算法可以用于监督学习、非监督学习、强化学习或半监督学习。在本书中,你将学会如何使用这些算法来解决所遇到的问题,并了解这些算法的工作方式。本书还将介绍自然语言处理和推荐系统,这些内容将帮助大家进行多种算法的实践。

朱塞佩·博纳科尔索(Giuseppe Bonaccorso),一家大型跨国公司的数据科学主管。他拥有意大利卡塔尼亚大学电子工程专业工程学硕士学位,然后在意大利罗马第二大学、英国埃塞克斯大学深造过。在他的职业生涯中,担任过公共管理、军事、公用事业、医疗保健、诊断和广告等多个业务领域的IT工程师,使用Java、Python、Hadoop、Spark、Theano和TensorFlow等多种技术进行过项目开发与管理。他的主要研究兴趣包括人工智能、机器学习、深度学习、强化学习、数据科学等。

译者:罗娜,博士,副研究员,在华东理工大学信息科学工程学院任教。研究方向为机器学习算法及其在工业中的应用。作为项目负责人,先后承担了国家自然科学基金青年科学基金、上海市自然科学基金等多项课题的研究工作,并作为技术负责人承担了多项中石化科技攻关项目,发表相关学术论文20余篇,申请国家发明专利两项,登记软件著作权两项。

作品目录

  • 译者序
  • 前言
  • 第1章 机器学习简介
  • 1.1 简介——经典机器和自适应的机器
  • 1.2 关于学习
  • 1.3 超越机器学习——深度学习和基于生物启发的适应系统
  • 1.4 机器学习和大数据
  • 1.5 本章小结
  • 第2章 机器学习的重要元素
  • 2.1 数据格式
  • 2.2 可学习性
  • 2.3 统计学习方法介绍
  • 2.4 类平衡
  • 2.5 信息论的要素
  • 2.6 本章小结
  • 第3章 特征选择与特征工程
  • 3.1 scikit-learn的toy数据集
  • 3.2 创建训练集和测试集
  • 3.3 管理分类数据
  • 3.4 管理缺失特征
  • 3.5 数据缩放和归一化
  • 3.6 特征选择和过滤
  • 3.7 主成分分析
  • 3.8 独立成分分析
  • 3.9 原子提取和字典学习
  • 3.10 使用t-SNE可视化高维数据集
  • 3.11 本章小结
  • 第4章 回归算法
  • 4.1 线性模型
  • 4.2 一个二维的例子
  • 4.3 基于scikit-learn的线性回归和更高维
  • 4.4 Ridge回归、Lasso回归和ElasticNet
  • 4.5 稳健回归
  • 4.6 贝叶斯回归
  • 4.7 多项式回归
  • 4.8 保序回归
  • 4.9 本章小结
  • 第5章 线性分类算法
  • 5.1 线性分类
  • 5.2 逻辑回归
  • 5.3 实现和优化
  • 5.4 随机梯度下降算法
  • 5.5 被动攻击算法
  • 5.6 通过网格搜索找到最优超参数
  • 5.7 评估分类的指标
  • 5.8 ROC曲线
  • 5.9 本章小结
  • 第6章 朴素贝叶斯和判别分析
  • 6.1 贝叶斯定理
  • 6.2 朴素贝叶斯分类器
  • 6.3 scikit-learn中的朴素贝叶斯
  • 6.4 判别分析
  • 6.5 本章小结
  • 第7章 支持向量机
  • 7.1 线性支持向量机
  • 7.2 scikit-learn实现
  • 7.3 基于内核的分类
  • 7.4 受控支持向量机
  • 7.5 支持向量回归
  • 7.6 半监督支持向量机简介
  • 7.7 本章小结
  • 第8章 决策树和集成学习
  • 8.1 二元决策树
  • 8.2 基于scikit-learn的决策树分类
  • 8.3 决策树回归
  • 8.4 集成学习简介
  • 8.5 本章小结
  • 第9章 聚类原理
  • 9.1 聚类基础
  • 9.2 k-NN算法
  • 9.3 高斯混合
  • 9.4 k-means
  • 9.5 基于样本标记的评价方法
  • 9.6 本章小结
  • 第10章 高级聚类
  • 10.1 DBSCAN
  • 10.2 谱聚类
  • 10.3 在线聚类
  • 10.4 双聚类
  • 10.5 本章小结
  • 第11章 层次聚类
  • 11.1 分层策略
  • 11.2 凝聚聚类
  • 11.3 本章小结
  • 第12章 推荐系统介绍
  • 12.1 朴素的基于用户的系统
  • 12.2 基于内容的系统
  • 12.3 无模式(或基于内存的)协同过滤
  • 12.4 基于模型的协同过滤
  • 12.5 本章小结
  • 第13章 自然语言处理简介
  • 13.1 NLTK和内置语料库
  • 13.2 词袋策略
  • 13.3 词性
  • 13.4 示例文本分类器
  • 13.5 本章小结
  • 第14章 NLP中的主题建模与情感分析
  • 14.1 主题建模
  • 14.2 使用Gensim的Word2vec简介
  • 14.3 情感分析
  • 14.4 本章小结
  • 第15章 神经网络介绍
  • 15.1 深度学习简介
  • 15.2 基于Keras的MLP
  • 15.3 本章小结
  • 第16章 高级深度学习模型
  • 16.1 深层结构
  • 16.2 基于Keras的深度卷积网络示例
  • 16.3 基于Keras的LSTM网络示例
  • 16.4 TensorFlow简介
  • 16.5 本章小结
  • 第17章 创建机器学习架构
  • 17.1 机器学习框架
  • 17.2 用于机器学习架构的scikit-learn工具
  • 17.3 本章小结
展开全部