作品简介

本书理论与实践相结合,详细阐述机器学习数据特征与分类算法,基于Python 3精心编排大量的机器学习场景与开源平台应用,高效利用Python 3代码翔实地阐释机器学习核心算法及其工具的场景应用。本书分为6章,主要内容包括机器学习概述、数据特征、分类算法、项目,以及在机器学习平台Kaggle与PaddlePaddle上实现分类、预测及推荐等实战操作。本书适合机器学习的研究人员、计算机或数学等相关从业者参考学习,也可以作为计算机或数学等专业本科高年级或研究生专业用书。

邓立国,东北大学计算机应用博士毕业。2005年开始在沈阳师范大学软件学院、教育技术学院任教,主要研究方向:数据挖掘、知识工程、大数据处理、云计算、分布式计算等。以第一作者发表学术论文30多篇(26篇EI),主编教材1部,主持科研课题6项,经费10余万元,多次获得校级科研优秀奖,作为九三社员提出的智慧城市提案被市政府采纳,研究成果被教育厅等单位采用。

作品目录

  • 内容简介
  • 前言
  • 第1章 机器学习概述
  • 1.1 机器学习定义
  • 1.2 机器学习的发展
  • 1.3 机器学习的分类
  • 1.4 机器学习的研究领域
  • 1.5 本章小结
  • 第2章 机器学习数据特征
  • 2.1 数据分布性
  • 2.2 数据相关性
  • 2.3 数据聚类性
  • 2.4 数据主成分分析
  • 2.5 数据动态性
  • 2.6 数据可视化
  • 2.7 本章小结
  • 第3章 机器学习分类算法
  • 3.1 数据清洗和特征选择
  • 3.2 决策树、随机森林
  • 3.3 SVM
  • 3.4 聚类算法
  • 3.5 EM算法
  • 3.6 贝叶斯算法
  • 3.7 隐马尔可夫模型
  • 3.8 LDA主题模型
  • 3.9 人工神经网络
  • 3.10 KNN算法
  • 3.11 本章小结
  • 第4章 Python机器学习项目
  • 4.1 SKlearn
  • 4.2 TensorFlow
  • 4.3 Theano
  • 4.4 Caffe
  • 4.5 Gensim
  • 4.6 Pylearn2
  • 4.7 Shogun
  • 4.8 Chainer
  • 4.9 NuPIC
  • 4.10 Neon
  • 4.11 Nilearn
  • 4.12 Orange3
  • 4.13 PyMC与PyMC3
  • 4.14 PyBrain
  • 4.15 Fuel
  • 4.16 PyMVPA
  • 4.17 Annoy
  • 4.18 Deap
  • 4.19 Pattern
  • 4.20 Requests
  • 4.21 Seaborn
  • 4.22 本章小结
  • 第5章 Kaggle平台机器学习实战
  • 5.1 Kaggle信用卡欺诈检测
  • 5.2 Kaggle机器学习案例
  • 5.3 本章小结
  • 第6章 PaddlePaddle平台机器学习实战
  • 6.1 PaddlePaddle平台安装
  • 6.2 PaddlePaddle平台手写体数字识别
  • 6.3 PaddlePaddle平台图像分类
  • 6.4 PaddlePaddle平台词向量
  • 6.5 PaddlePaddle平台个性化推荐
  • 6.6 PaddlePaddle平台情感分析
  • 6.7 本章小结
  • 参考文献
展开全部