作品简介

本书以任务为导向,全面地介绍数据分析的流程和Python数据分析库的应用,详细讲解利用Python解决企业实际问题的方法。全书共9章,第1章介绍了数据分析的基本概念等相关知识;第2~6章介绍了Python数据分析的常用库及其应用,涵盖NumPy数值计算、Matplotlib数据可视化、pandas统计分析、使用pandas进行数据预处理、使用scikit-learn构建模型,较为全面地阐述了Python数据分析方法;第7~9章结合之前所学的数据分析技术,进行企业综合案例数据分析。除第1章外,本书各章都包含了实训与课后习题,通过练习和操作实践,帮助读者巩固所学的内容。本书可作为高校大数据技术类专业的教材,也可以作为大数据技术爱好者的自学用书。

张良均,高级信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛(www.tipdm.org)的发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数二十余篇,已取得国家发明专利12项,主编图书《神经网络实用教程》《数据挖掘:实用案例分析》《Python数据分析与挖掘》等多本畅销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。

作品目录

  • 大数据专业系列图书编写委员会
  • 前言
  • 第1章 Python数据分析概述
  • 任务1.1 认识数据分析
  • 任务1.2 熟悉Python数据分析的工具
  • 任务1.3 安装Python的Anaconda发行版
  • 任务1.4 掌握Jupyter Notebook常用功能
  • 小结
  • 课后习题
  • 第2章 NumPy数值计算基础
  • 任务2.1 掌握NumPy数组对象ndarray
  • 任务2.2 掌握NumPy矩阵与通用函数
  • 任务2.3 利用NumPy进行统计分析
  • 小结
  • 实训
  • 课后习题
  • 第3章 Matplotlib数据可视化基础
  • 任务3.1 掌握绘图基础语法与常用参数
  • 任务3.2 分析特征间的关系
  • 任务3.3 分析特征内部数据分布与分散状况
  • 小结
  • 实训
  • 课后习题
  • 第4章 pandas统计分析基础
  • 任务4.1 读/写不同数据源的数据
  • 任务4.2 掌握DataFrame的常用操作
  • 任务4.3 转换与处理时间序列数据
  • 任务4.4 使用分组聚合进行组内计算
  • 任务4.5 创建透视表与交叉表
  • 小结
  • 实训
  • 课后习题
  • 第5章 使用pandas进行数据预处理
  • 任务5.1 合并数据
  • 任务5.2 清洗数据
  • 任务5.3 标准化数据
  • 任务5.4 转换数据
  • 小结
  • 实训
  • 课后习题
  • 第6章 使用scikit-learn构建模型
  • 任务6.1 使用sklearn转换器处理数据
  • 任务6.2 构建并评价聚类模型
  • 任务6.3 构建并评价分类模型
  • 任务6.4 构建并评价回归模型
  • 小结
  • 实训
  • 课后习题
  • 第7章 航空公司客户价值分析
  • 任务7.1 了解航空公司现状与客户价值分析
  • 任务7.2 预处理航空客户数据
  • 任务7.3 使用K-Means算法进行客户分群
  • 小结
  • 实训
  • 课后习题
  • 第8章 财政收入预测分析
  • 任务8.1 了解财政收入预测的背景与方法
  • 任务8.2 分析财政收入数据特征的相关性
  • 任务8.3 使用Lasso回归选取财政收入预测的关键特征
  • 任务8.4 使用灰色预测和SVR构建财政收入预测模型
  • 小结
  • 实训
  • 课后习题
  • 第9章 家用热水器用户行为分析与事件识别
  • 任务9.1 了解家用热水器用户行为分析的背景与步骤
  • 任务9.2 预处理热水器用户用水数据
  • 任务9.3 构建用水行为特征并筛选用水事件
  • 任务9.4 构建行为事件分析的BP神经网络模型
  • 小结
  • 实训
  • 课后习题
  • 附录A
  • 附录B
  • 参考文献
展开全部