作品简介

本书共13章,主要内容涵盖Python语法及数据分析方法。第1章主要介绍数据分析的概念,使读者有一个大致的印象,并简单介绍本书频繁使用的Python的5个第三方库。第2章主要做一些准备工作,手把手带读者搭建Python环境,包括Python 3.7.6的安装和pip的安装。第3章介绍Python编程基础。第4章到第7章介绍使用Python进行简单数据分析的基础库,包括NumPy、Pandas和Matplotlib库,并介绍使用正则表达式处理数据的方法。第8章到第13章属于进阶内容,但也是Python数据分析的基础,结合机器学习介绍一些常见的用于数据分析的机器学习算法及常用的数学模型。本书内容通俗易懂,案例丰富,实用性强,适合有一定Python基础的读者阅读,也适合对数据分析和数据科学感兴趣的学生、Python程序员及其他编程爱好者阅读。

田越,曾参加蓝桥杯和ACM等算法竞赛,以及微软公司举办的创新杯竞赛,对于数据分析技术有着执着的追求,善于在学习中发现自己的不足,并将其转化为努力向前的动力。

作品目录

  • 内容简介
  • 前言
  • 第1章 数据分析存在的意义
  • 1.1 数据分析与Python
  • 1.2 本书的主要内容
  • 第2章 开始前的准备
  • 2.1 Python 3.7.6的安装
  • 2.2 pip的安装
  • 第3章 Python编程基础
  • 3.1 Python编程初识
  • 3.2 Python编程常用类型
  • 3.3 Python的条件、循环和分支语句以及异常处理
  • 3.4 其他关于Python的重要知识点
  • 第4章 线性代数知识和第三方库NumPy的使用
  • 4.1 必要的线性代数知识
  • 4.2 NumPy库的基础操作
  • 4.3 用NumPy库实现矩阵运算
  • 第5章 使用正则表达式处理数据
  • 5.1 RE模块简述
  • 5.2 使用正则表达式模块
  • 第6章 使用Pandas库处理数据
  • 6.1 Pandas库简述
  • 6.2 三种格式的文件后缀简述
  • 6.3 处理.csv格式的数据
  • 6.4 处理非.csv格式的数据
  • 6.5 Pandas库的其他常用操作
  • 第7章 使用Matplotlib库实现数据可视化
  • 7.1 Matplotlib库简述
  • 7.2 Matplotlib库的基本方法
  • 7.3 使用Matplotlib库绘制图表
  • 第8章 数学模型与数理统计
  • 8.1 走进数学模型
  • 8.2 必要的数理统计知识
  • 第9章 线性回归
  • 9.1 最小二乘法与切比雪夫准则
  • 9.2 OLS回归模型
  • 9.3 LAD回归模型
  • 9.4 OLS回归模型与LAD回归模型
  • 9.5 从极大似然估计再审视线性回归
  • 第10章 分类问题与逻辑回归
  • 10.1 逻辑回归:从分类问题谈起
  • 10.2 从梯度上升法与梯度下降法到逻辑回归
  • 第11章 模型评估与模型改进
  • 11.1 线性回归模型的评估与改进
  • 11.2 逻辑回归模型的评估与改进
  • 第12章 聚类:K-means算法
  • 12.1 K-means算法及相关内容的基本概念
  • 12.2K-means算法的Python实现
  • 第13章 分类:KNN算法
  • 13.1 KNN算法的基本概念
  • 13.2 KNN算法的Python实现
  • 13.3 结语:关于数据分析
展开全部