作品简介

本书由一线的资深数据分析师精写,以新版Python3.10作为数据分析与挖掘的编程语言,循序渐进地介绍了Python数据分析的方法与技巧以及机器学习算法及其应用案例。全书首先讲解Python基础语法,以便于从未接触过编程的读者能够快速上手,然后介绍了当前流行的常用数据分析工具,如数值计算工具NumPy、数据处理工具Pandas、数据可视化工具Matplotlib和数据挖掘工具Sklearn等,最后介绍了10大常用机器学习算法及其在数据挖掘中的应用,针对每一个算法均给出了案例实现,以便于读者能够学有所用。本书凝聚编者十余年工作心得,以丰富实例介绍理论知识,并给出大量应用实践,很适合初入数据分析职场的从业者提升技能,本书也可以作为统计学、数学、经济学、金融学、管理学以及相关理工科专业的本科生、研究生的教学参考书。

王国平,毕业于上海海洋大学,硕士,从业十余年,主要从事数据可视化、数据挖掘和大数据分析与研究等工作。精通Tableau、SPSS、SPSS Modeler、Power BI等软件,已出版《IBM SPSS Modeler数据与文本挖掘实战》《Microsoft Power BI数据可视化与数据分析》《Tableau数据可视化从入门到精通》《SPSS统计分析与行业应用实战》等专著 。

作品目录

  • 前言
  • 第1章 构建数据分析开发环境
  • 1.1 数据分析概述
  • 1.2 开发环境的构建
  • 1.3 必会的Python数据分析包
  • 1.4 一个简单的数据分析案例
  • 1.5 小结与课后练习
  • 第2章 Python核心基础
  • 2.1 Python数据类型
  • 2.2 Python基础语法
  • 2.3 Python高阶函数
  • 2.4 Python编程技巧
  • 2.5 小结与课后练习
  • 第3章 Python数据分析基础
  • 3.1 数据的读取
  • 3.2 数据的索引
  • 3.3 数据的切片
  • 3.4 数据的聚合
  • 3.5 小结与课后练习
  • 第4章 NumPy数组操作
  • 4.1 NumPy索引与切片
  • 4.2 NumPy维数变换
  • 4.3 NumPy广播机制
  • 4.4 NumPy矩阵运算
  • 4.5 小结与课后练习
  • 第5章 Pandas数据清洗
  • 5.1 重复值检测与处理
  • 5.2 缺失值检测与处理
  • 5.3 异常值检测与处理
  • 5.4 金融数据的处理实战
  • 5.5 小结与课后练习
  • 第6章 Matplotlib数据可视化
  • 6.1 图形参数设置
  • 6.2 绘图参数文件及主要函数
  • 6.3 Matplotlib图形整合
  • 6.4 Matplotlib可视化案例
  • 6.5 小结与课后练习
  • 第7章 Scikit-Learn机器学习
  • 7.1 机器学习及其类型
  • 7.2 Sklearn机器学习概述
  • 7.3 Sklearn机器学习流程
  • 7.4 Sklearn自带的数据集
  • 7.5 小结与课后练习
  • 第8章 监督式机器学习
  • 8.1 线性回归及其案例
  • 8.2 逻辑回归及其案例
  • 8.3 Lasso回归与Ridge回归
  • 8.4 决策树及其案例
  • 8.5 K近邻算法及其案例
  • 8.6 支持向量机及其案例
  • 8.7 小结与课后练习
  • 第9章 无监督式机器学习
  • 9.1 聚类分析及其案例
  • 9.2 因子分析及其案例
  • 9.3 主成分分析及其案例
  • 9.4 关联分析及其案例
  • 9.5 离群点检测及其案例
  • 9.6 双聚类分析及其案例
  • 9.7 小结与课后练习
  • 第10章 模型评估与调优
  • 10.1 机器学习的挑战
  • 10.2 模型的评估方法
  • 10.3 模型的调优方法
  • 10.4 小结与课后练习
  • 第11章 Python中文文本分析
  • 11.1 中文结巴分词
  • 11.2 中文关键词提取
  • 11.3 中文词向量生成
  • 11.4 中文情感分析
  • 11.5 小结与课后练习
  • 附录A Python 3.10.0及第三方库安装
  • 附录B Python常用第三方工具包简介
  • B.1 数据分析类包
  • B.2 数据可视化类包
  • B.3 机器学习类包
展开全部