作品简介

本书循序渐进地讲解了使用Python语言实现数据分析的核心知识,并通过具体实例的实现过程演示了数据分析的方法和流程。全书共12章,内容包括Python语言基础、处理网络数据、网络爬虫实战、处理特殊文本格式、使用数据库保存数据、操作处理CSV文件、操作处理JSON数据、使用库matplotlib实现数据可视化处理、使用库pygal实现数据可视化处理、使用库numPy实现数据可视化处理、使用库pandas实现数据可视化处理和大数据实战案例。全书简洁而不失技术深度,内容丰富全面。不仅易于阅读,同时涵盖了其他同类图书中很少涉及的参考资料,是学习Python数据分析的实用教程。

本书适用于已了解Python语言基础语法、希望进一步提高自己Python开发水平的读者,还可作为大中专院校和培训学校相关专业师生的学习参考用书。

李梓萌,女,高级工程师,毕业于清华大学,供职于阿里巴巴淘宝事业部。工作项目涉及金融科技、证券交易所、银行、生物信息学、基因组学、广告技术、基础设施、交通运输、能源、人力资源和娱乐等多个领域的数据分析工作。在预测分析、数据科学、机器学习、大数据、产品工程、高性能计算和云基础设施等项目中工作了8年。

作品目录

  • 前言
  • 第1章 Python语言基础
  • 1.1 Python语言介绍
  • 1.2 安装Python
  • 1.3 Python开发工具介绍
  • 1.4 认识第一段Python程序
  • 第2章 处理网络数据
  • 2.1 处理HTML和XML数据
  • 2.2 处理HTTP数据
  • 2.3 处理URL数据
  • 2.4 爬取新闻保存到XML文件并分析特征关系
  • 第3章 网络爬虫实战
  • 3.1 网络爬虫基础
  • 3.2 开发简单的网络爬虫应用程序
  • 3.3 使用爬虫框架Scrapy
  • 第4章 处理特殊文本格式
  • 4.1 使用tablib模块
  • 4.2 使用openpyxl处理Office文件
  • 4.3 使用pyexcel处理Office文件
  • 4.4 使用python-docx处理Office文件
  • 4.5 使用xlrd和xlwt读写Excel
  • 4.6 使用xlsxwriter操作Excel文件
  • 第5章 使用数据库保存数据
  • 5.1 操作SQLite3数据库
  • 5.2 操作MySQL数据库
  • 5.3 使用MariaDB数据库
  • 5.4 使用MongoDB数据库
  • 5.5 使用ORM操作数据库
  • 第6章 操作处理CSV文件
  • 6.1 内置CSV模块介绍
  • 6.2 爬取图书信息并保存为CSV文件
  • 6.3 使用CSV文件保存Scrapy抓取的数据
  • 第7章 操作处理JSON数据
  • 7.1 类型转换
  • 7.2 JSON编码和解码
  • 7.3 分析JSON格式的世界人口数据
  • 7.4 挖掘并分析日志文件数据
  • 7.5 统计分析朋友圈的数据
  • 7.6 爬虫抓取照片资料
  • 第8章 使用库matplotlib实现数据可视化处理
  • 8.1 安装库matplotlib
  • 8.2 库matplotlib的基本操作
  • 8.3 绘制随机漫步图
  • 8.4 大数据分析某年最高温度和最低温度
  • 8.5 在Tkinter中使用matplotlib绘制图表
  • 8.6 爬取热门电影信息并制作数据分析饼状图
  • 第9章 使用库pygal实现数据可视化处理
  • 9.1 安装库pygal
  • 9.2 pygal的基本操作
  • 9.3 分析与图书销售相关的数据
  • 9.4 使用pygal分析网络数据
  • 9.5 绘制比特币收盘价数据折线图
  • 第10章 使用库numPy实现数据可视化处理
  • 10.1 库numPy基础
  • 10.2 库numPy通用函数
  • 10.3 联合使用numPy和matplotlib
  • 10.4 大数据分析最受欢迎的儿童名字
  • 第11章 使用库pandas实现数据可视化处理
  • 11.1 安装库pandas
  • 11.2 从CSV文件读取数据
  • 11.3 日期相关操作
  • 11.4 分析服务器日志数据
  • 11.5 使用pandas提取数据并构建Neo4j知识图谱
  • 第12章 大数据实战:电影票房系统
  • 12.1 背景介绍
  • 12.2 需求分析
  • 12.3 模块架构
  • 12.4 爬取数据
  • 12.5 数据分析
展开全部