作品简介

这是一本以项目实战案例为驱动的数据挖掘著作,它能帮助完全没有Python编程基础和数据挖掘基础的读者快速掌握Python数据挖掘的技术、流程与方法。

在写作方式上,本书与传统的“理论与实践结合”的入门书不同,它以数据挖掘领域的知名赛事“泰迪杯”数据挖掘挑战赛(已举办10届)和“泰迪杯”数据分析技能赛(已举办5届)(累计1500余所高校的10余万师生参赛)为依托,精选了11个经典赛题,将Python编程知识、数据挖掘知识和行业知识三者融合,让读者在实践中快速掌握电商、教育、交通、传媒、电力、旅游、制造等7大行业的数据挖掘方法。

本书不仅适用于零基础的读者自学,还适用于教师教学,为了帮助读者更加高效地掌握本书的内容,本书提供了以下10项附加价值:

(1)建模平台:提供一站式大数据挖掘建模平台,免配置,包含大量案例工程,边练边学,告别纸上谈兵

(2)视频讲解:提供不少于600分钟Python编程和数据挖掘相关教学视频,边看边学,快速收获经验值

(3)精选习题:精心挑选不少于60道数据挖掘练习题,并提供详细解答,边学边练,检查知识盲区

(4)作者答疑:学习过程中有任何问题,通过“树洞”小程序,纸书拍照,一键发给作者,边问边学,事半功倍

(5)数据文件:提供各个案例配套的数据文件,与工程实践结合,开箱即用,增强实操性

(6)程序代码:提供书中代码的电子文件及相关工具的安装包,代码导入平台即可运行,学习效果立竿见影

(7)教学课件:提供配套的PPT课件,使用本书作为教材的老师可以申请,节省备课时间

(8)模型服务:提供不少于10个数据挖掘模型,模型提供完整的案例实现过程,助力提升数据挖掘实践能力

(9)教学平台:泰迪科技为本书提供的附加资源提供一站式数据化教学平台,附有详细操作指南,边看边学边练,节省时间

(10)就业推荐:提供大量就业推荐机会,与1500+企业合作,包含华为、京东、美的等知名企业

通过学习本书,读者可以理解数据挖掘的原理,迅速掌握大数据技术的相关操作,为后续数据分析、数据挖掘、深度学习的实践及竞赛打下良好的技术基础。

张良均,资深大数据专家,高级信息系统项目管理师,广东泰迪智能科技股份有限公司董事长。中国信访大数据学术与应用研究联盟副理事长,中国信息协会医疗卫生和健康产业分会医学人工智能学组常委,广东省工业与应用数学学会常务理事,“泰迪杯”数据挖掘挑战赛发起人。华南师范大学、中南财经政法大学、广东工业大学、西安理工大学、广西科技大学、重庆交通大学、桂林电子科技大学、五邑大学等30余所高校兼职教授或硕导。入选国家科技专家库、广东省综合评标专家库、广州市大数据/人工智能专家库、广东省创新基金专家库、广州市科技专家库、广州市节能专家库、广州公共资源交易中心专家库、广东省科技咨询专家库。在国内外重要学术刊物上发表论文12篇(其中作为第一作者的论文有7篇);主导编写图书70余部,其中入选“十三五”职业教育国家规划教材一部;承担国家级项目1项,省部级项目4项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有信访、电力、电信、银行、制造企业、电子商务、电子政务的项目经验和行业背景,并荣获中国产学研合作促进奖、中国南方电网公司发明专利一等奖、广东省农业技术推广二等奖、广州市荔湾区科学技术进步奖。

作品目录

  • Preface前言
  • 第一篇 基础篇
  • Chapter 1 第1章 数据挖掘概述
  • 1.1 数据挖掘简介
  • 1.2 数据挖掘的通用流程
  • 1.3 常用数据挖掘工具
  • 1.4 Python数据挖掘环境配置
  • 1.5 小结
  • Chapter 2 第2章 Python数据挖掘编程基础
  • 2.1 Python使用入门
  • 2.2 Python数据分析及预处理常用库
  • 2.3 Python数据挖掘建模常用框架和库
  • 2.4 小结
  • 第二篇 入门篇
  • Chapter 3 第3章 电商平台手机销售数据采集与分析
  • 3.1 背景与目标
  • 3.2 数据采集
  • 3.3 数据探索与预处理
  • 3.4 数据可视化分析
  • 3.5 制定营销策略
  • 3.6 小结
  • Chapter 4 第4章 自动售货机销售数据分析与应用
  • 4.1 背景与目标
  • 4.2 数据读取与预处理
  • 4.3 销售数据可视化分析
  • 4.4 销售额预测
  • 4.5 小结
  • Chapter 5 第5章 教育平台的线上课程推荐策略
  • 5.1 背景与目标
  • 5.2 数据探索
  • 5.3 数据预处理
  • 5.4 平台的运营状况分析
  • 5.5 Apriori模型的构建
  • 5.6 制定课程推荐策略
  • 5.7 小结
  • 第三篇 进阶篇
  • Chapter 6 第6章 电视产品的营销推荐
  • 6.1 背景与目标
  • 6.2 数据预处理
  • 6.3 分析与建模
  • 6.4 模型评价
  • 6.5 小结
  • Chapter 7 第7章 运输车辆安全驾驶行为分析
  • 7.1 背景与目标
  • 7.2 构建车辆驾驶行为指标
  • 7.3 数据探索分析
  • 7.4 驾驶行为聚类分析
  • 7.5 构建驾驶行为预测模型
  • 7.6 驾驶行为安全分析总结
  • 7.7 小结
  • Chapter 8 第8章 基于非侵入式负荷监测与分解的电力数据挖掘
  • 8.1 背景与目标
  • 8.2 数据准备
  • 8.3 属性构建
  • 8.4 模型训练
  • 8.5 性能度量
  • 8.6 小结
  • Chapter 9 第9章 游客目的地印象分析
  • 9.1 背景与目标
  • 9.2 数据预处理
  • 9.3 目的地印象分析
  • 9.4 目的地评分分析
  • 9.5 目的地特色分析
  • 9.6 提升目的地美誉度的建议
  • 9.7 小结
  • 第四篇 高阶篇
  • Chapter 10 第10章 智能阅读模型的构建
  • 10.1 背景与目标
  • 10.2 数据探索
  • 10.3 关键词匹配
  • 10.4 精准匹配
  • 10.5 模型应用
  • 10.6 小结
  • Chapter 11 第11章 岩石样本智能识别
  • 11.1 背景与目标
  • 11.2 数据预处理
  • 11.3 模型构建
  • 11.4 模型评价
  • 11.5 小结
  • Chapter 12 第12章 电商平台图像中文字的识别
  • 12.1 背景与目标
  • 12.2 数据预处理
  • 12.3 文字识别
  • 12.4 模型评价
  • 12.5 小结
  • Chapter 13 第13章 电力巡检智能缺陷检测
  • 13.1 背景与目标
  • 13.2 图像探索
  • 13.3 图像预处理
  • 13.4 图像分割
  • 13.5 目标检测
  • 13.6 小结
  • 第五篇 拓展篇
  • Chapter 14 第14章 基于TipDM大数据挖掘建模平台实现自动售货机销售数据分析
  • 14.1 平台简介
  • 14.2 实现自动售货机销售数据分析项目
  • 14.3 小结
  • 推荐阅读
展开全部