作品简介

本书采用理论知识与任务案例相结合的形式,以PyCharm为主要开发工具,系统地阐述了大数据分析处理工作流程中的重要步骤,介绍了大数据分析过程中常用的几种第三方库。本书共13个单元,第1单元介绍了大数据分析处理的概念;第2、3单元介绍了大数据分析中科学计算与统计分析的相关知识;第4-7单元介绍了使用Pandas实现数据预处理的方法;第8单元介绍了使用Scikit-learn实现简单的机器学习的方法;第9单元介绍了使用Matplotlib、Seaborn绘制图表的方法;第10-13单元分别介绍了4个大数据分析处理的综合案例。单元1-9中,每个单元都包含了相关知识部分和任务实现部分,任务实现部分一般包含多个任务的具体实现过程,每个任务后面都有课堂实践,通过完成实践操作,读者可以进一步巩固所学知识。

本书既可作为高等院校大数据技术专业的教材,也可作为大数据爱好者的自学书籍。

郭永洪,常州信息职业技术学院大数据技术专业负责人,具有丰富大数据技术专业相关教学和科研工作经验,为国家级教学团队成员、国家级职业教育教师教学创新团队成员、江苏省高校“青蓝工程”优秀青年骨干教师、江苏省优秀毕业设计团队指导老师;参与国家精品资源共享课、国家在线开放课、软件技术专业国家教学资源库、省在线开放课程等建设;获江苏省教学成果一等奖一项、二等奖一项。主要讲授大数据分析处理、数据库管理与应用、C#应用开发、UML建模与设计模式、Web前端开发等课程;参与编写国家规划教材《软件开发与项目管理》、《信息技术基础》,主编高职高专规划教材《XML案例教材》,主编常州信息职业技术学院精品教材《.NET Web应用开发》。

作品目录

  • 内容提要
  • 前言FOREWORD
  • 单元1 大数据分析概述
  • 学习目标
  • 相关知识
  • 任务实现
  • 素养拓展
  • 单元小结
  • 课后习题
  • 单元2 numpy科学计算基础
  • 学习目标
  • 相关知识
  • 任务实现
  • 素养拓展
  • 单元小结
  • 课后习题
  • 单元3 pandas统计分析基础
  • 学习目标
  • 相关知识
  • 任务实现
  • 素养拓展
  • 单元小结
  • 课后习题
  • 单元4 数据读取与写入
  • 学习目标
  • 相关知识
  • 任务实现
  • 素养拓展
  • 单元小结
  • 课后习题
  • 单元5 数据质量与数据清洗
  • 学习目标
  • 相关知识
  • 任务实现
  • 素养拓展
  • 单元小结
  • 课后习题
  • 单元6 数据合并与数据转换
  • 学习目标
  • 相关知识
  • 任务实现
  • 素养拓展
  • 单元小结
  • 课后习题
  • 单元7 数据分组与数据聚合
  • 学习目标
  • 相关知识
  • 任务实现
  • 素养拓展
  • 单元小结
  • 课后习题
  • 单元8 scikit-learn机器学习
  • 学习目标
  • 相关知识
  • 任务实现
  • 素养拓展
  • 单元小结
  • 课后习题
  • 单元9 使用统计图表展示数据
  • 学习目标
  • 相关知识
  • 任务实现
  • 素养拓展
  • 单元小结
  • 课后习题
  • 单元10 某地区电力公司用户付费行为预测
  • 项目目标
  • 相关背景知识
  • 任务实现
  • 项目总结
  • 项目实践
  • 单元11 《你好,旧时光》文本挖掘分析
  • 项目目标
  • 相关背景知识
  • 任务实现
  • 项目总结
  • 项目实践
  • 单元12 基于大数据可视化的城市通勤特征分析研究
  • 项目目标
  • 相关背景知识
  • 任务实现
  • 项目总结
  • 项目实践
  • 单元13 上市公司新闻情感与股票价格的关系
  • 项目目标
  • 相关背景知识
  • 任务实现
  • 项目总结
  • 项目实践
展开全部