作品简介

本书是一本通过实战教初学者学习采集数据、清洗和组织数据进行分析及可视化的Python读物。书中案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为一名数据行业的“码农”,数据就是沃土,没有数据,我们将无田可耕。

本书共分11章,6个核心主题:其一是Python基础入门,包括环境配置、基本操作、数据类型、语句和函数;其二是Python爬虫的构建,包括网页结构解析、爬虫流程设计、代码优化、效率优化、容错处理、反防爬虫、表单交互和模拟页面点击;其三是Python数据库应用,包括MongoDB、MySQL在Python中的连接与应用;其四是数据清洗和组织,包括NumPy数组知识、pandas数据的读写、分组变形、缺失值异常值处理、时序数据处理和正则表达式的使用;其五是综合应用案例,帮助读者贯穿爬虫、数据清洗与组织的过程;最后是数据可视化,包括Matplotlib和Pyecharts两个库的使用,涉及饼图、柱形图、线图、词云图、地图等图形,帮助读者进入可视化的殿堂。

本书以实战为主,适合Python初学者及高等院校的相关专业学生,也适合Python培训机构作为实验教材使用。

零一,原名陈海城,沐垚科技创始人,电商自媒体,资深数据分析师,8年电商从业经验,擅长Excel、PowerBI、R、Python等工具,主要研究数据化运营、商业智能和人工智能在电商领域的应用,专注数据+电商的新零售服务。出版《电商数据分析淘宝实战》《美丽的电商运营日记》《ExcelBI之道:从零开始学Power工具应用》《淘宝、天猫电商数据分析与挖掘实战》

联系方式:公众号:start_data,个人号:haicheng1008,邮箱:lingyi@muyaotech.com

作品目录

  • 作者介绍
  • 前言
  • 第1章 Python 基础
  • 1.1 安装 Python 环境
  • 1.2 Python 操作入门
  • 1.3 Python数据类型
  • 1.4 Python 语句与函数
  • 第2章 写一个简单的爬虫
  • 2.1 关于爬虫的合法性
  • 2.2 了解网页
  • 2.3 使用 requests 库请求网站
  • 2.4 使用 Beautiful Soup 解析网页
  • 2.5 清洗和组织数据
  • 2.6 爬虫攻防战
  • 第3章 用 API 爬取天气预报数据
  • 3.1 注册免费 API 和阅读技术文档
  • 3.2 获取 API 数据
  • 3.3 存储数据到 MongoDB
  • 3.4 MongoDB 数据库查询
  • 第4章 大型爬虫案例:抓取某电商网站的商品数据
  • 4.1 观察页面特征和解析数据
  • 4.2 工作流程分析
  • 4.3 构建类目树
  • 4.4 获取产品列表
  • 4.5 代码优化
  • 4.6 爬虫效率优化
  • 4.7 容错处理
  • 第5章 Scrapy 爬虫
  • 5.1 Scrapy 简介
  • 5.2 Scrapy 安装
  • 5.3 案例:用 Scrapy 抓取股票行情
  • 第6章 Selenium 爬虫
  • 6.1 Selenium 简介
  • 6.2 案例:用 Selenium 抓取电商网站数据
  • 第7 章数据库连接和查询
  • 7.1 使用 PyMySQL
  • 7.2 使用 SQLAlchemy
  • 7.3 MongoDB
  • 第8章 NumPy
  • 8.1 NumPy 简介
  • 8.2 一维数组
  • 8.3 多维数组
  • 8.4 数组的运算
  • 第9章 pandas 数据清洗
  • 9.1 数据读写、选择、整理和描述
  • 9.2 数据分组、分割、合并和变形
  • 9.3 缺失值、异常值和重复值处理
  • 9.4 时序数据处理
  • 9.5 数据类型转换
  • 9.6 正则表达式
  • 第10章 综合应用实例
  • 10.1 按性价比给用户推荐旅游产品
  • 10.2 通过热力图分析为用户提供出行建议
  • 第11章 数据可视化
  • 11.1 matplotlib
  • 11.2 pyecharts
  • 专业服务
展开全部