作品简介

2017年年初,在中国信息协会大数据分会副会长刘鹏教授的倡议和组织下,全国上百家高校从事一线教学科研任务的教师,开展了高级大数据人才培养丛书的编撰工作。本书是丛书之一,其定位是大数据挖掘技术与应用。本书系统地介绍了数据挖掘算法理论与方法、工具和应用,包括经典数据挖掘算法,大数据环境下常用数据挖掘算法的优化,大数据新常态下催生的数据分析方法(如推荐系统、链接分析与网页排序、互联网信息抽取、日志挖掘与查询分析)、工具与应用。

本书适合作为相关专业本科生和研究生教材。高职高专学校也可以选用部分内容开展教学。本书也很适合作为大数据分析研发人员的自学书籍。

王朝霞,1995年在重庆大学获得学士学位,2003年在中国人民解放军后勤工程学院获得硕士学位,2012年在清华大学获得博士学位,现于中国人民解放军陆军勤务学院任教,副教授、硕导。计算机科学与技术学科、后勤信息化学科中青年骨干。

主(持)研科研项目35项,其中,主持科研项目1项、省部级6项。发表论文40余篇,SCI收录期刊论文2篇(1作)、EI收录论文10篇(1作6篇)。出版专著3本,获国家发明专利3项。获教育部科技进步一等奖1项,多次荣获学院优秀教员荣誉称号、学院教学研究成果奖和教学质量奖。

作品目录

  • 内容简介
  • 编 写 组
  • 总 序
  • 前 言
  • 第1章 绪 论
  • 1.1 数据挖掘概述
  • 1.2 数据挖掘起源及发展历史
  • 1.3 数据挖掘常用工具
  • 1.4 数据挖掘应用场景
  • 习题
  • 参考文献
  • 第2章 数据预处理与相似性
  • 2.1 数据类型
  • 2.2 数据预处理
  • 2.3 数据的相似性
  • 习题
  • 参考文献
  • 第3章 分 类
  • 3.1 分类的基本概念、分类过程及分类器性能的评估
  • 3.2 决策树
  • 3.3 贝叶斯分类
  • 3.4 支持向量机
  • 3.5 实战:决策树算法在Weka中的实现
  • 习题
  • 参考文献
  • 第4章 回 归
  • 4.1 回归概述
  • 4.2 一元回归分析
  • 4.3 多元线性回归分析
  • 4.4 逻辑回归分析
  • 4.5 其他回归分析
  • 4.6 实战:用回归分析方法给自己的房子定价
  • 习题
  • 参考文献
  • 第5章 聚 类
  • 5.1 聚类概述
  • 5.2 划分方法
  • 5.3 层次方法
  • 5.4 基于密度的方法
  • 5.5 实战:聚类分析
  • 习题
  • 参考文献
  • 第6章 关联规则
  • 6.1 概述
  • 6.2 Apriori算法:通过限制候选项集产生发现频繁项集
  • 6.3 FP-growth算法
  • 6.4 其他关联规则算法
  • 6.5 实战:个人信用关联规则挖掘
  • 习题
  • 参考文献
  • 第7章 常用大数据挖掘算法优化改进
  • 7.1 分类算法
  • 7.2 聚类算法
  • 7.3 关联规则
  • 习题
  • 参考文献
  • 第8章 推荐系统
  • 8.1 推荐系统概述
  • 8.2 基于内容的推荐
  • 8.3 协同过滤
  • 8.4 其他推荐技术
  • 8.5 实战:基于协同过滤算法推荐电影
  • 习题
  • 参考文献
  • 第9章 互联网数据挖掘
  • 9.1 链接分析与网页排序
  • 9.2 互联网信息抽取
  • 9.3 日志挖掘与查询分析
  • 习题
  • 参考文献
  • 附录A 数据挖掘工具Weka
  • A.1 Weka简介
  • A.2 Explorer界面
  • A.3 Knowledge Flow界面
  • A.4 Experimenter界面
  • 习题
  • 参考文献
  • 附录B Spark 机器学习库MLlib
  • B.1 Spark简介
  • B.2 Spark RDD
  • B.3 Spark MLlib简介
  • B.4 Spark MLlib数据类型
  • B.5 Spark MLlib算法库
  • 习题
  • 参考文献
  • 附录C 大数据和人工智能实验环境
展开全部