作品简介

大数据时代,大数据分析是关键技术。Python是一款优秀的大数据分析软件,本书以Python 3结合第三方开源工具进行大数据分析,以最小的代价编程实现数据的提取、处理、分析和可视化。本书分为8章,首先介绍大数据分析的背景和行业应用,给出了数据特征算法分析;然后基于Python 3介绍常用典型第三方大数据分析工具的场景应用;最后比较翔实地阐述大数据分析算法与经典实例应用。本书适合从事大数据分析的研究人员、计算机或数学等相关专业的从业者参考学习,也可以作为计算机或数学等专业本科高年级或研究生的专业用书。

邓立国,东北大学计算机应用博士毕业。2005年开始在沈阳师范大学软件学院、教育技术学院任教,主要研究方向:数据挖掘、知识工程、大数据处理、云计算、分布式计算等。以第一作者发表学术论文30多篇(26篇EI),主编教材1部,主持科研课题6项,经费10余万元,多次获得校级科研优秀奖,作为九三社员提出的智慧城市提案被市政府采纳,研究成果被教育厅等单位采用。

作品目录

  • 内容简介
  • 前言
  • 第1章 大数据分析概述
  • 1.1 大数据分析背景
  • 1.2 大数据分析的应用
  • 1.3 大数据分析算法
  • 1.4 大数据分析工具
  • 1.5 本章小结
  • 第2章 数据特征算法分析
  • 2.1 数据分布性分析
  • 2.2 数据相关性分析
  • 2.3 数据聚类性分析
  • 2.4 数据主成分分析
  • 2.5 数据动态性分析
  • 2.6 数据可视化
  • 2.7 本章小结
  • 第3章 大数据分析工具:NumPy
  • 3.1 NumPy简介
  • 3.2 NumPy环境安装配置
  • 3.3 ndarray对象
  • 3.4 数据类型
  • 3.5 数组属性
  • 3.6 数组创建例程
  • 3.7 切片和索引
  • 3.8 广播
  • 3.9 数组与元素操作
  • 3.10 位操作与字符串函数
  • 3.11 数学运算函数
  • 3.12 算术运算
  • 3.13 统计函数
  • 3.14 排序、搜索和计数函数
  • 3.15 字节交换
  • 3.16 副本和视图
  • 3.17 矩阵库
  • 3.18 线性代数模块
  • 3.19 Matplotlib库
  • 3.20 Matplotlib 绘制直方图
  • 3.21 IO文件操作
  • 3.22 NumPy实例:GPS定位
  • 3.23 本章小结
  • 第4章 大数据分析工具:SciPy
  • 4.1 SciPy简介
  • 4.2 文件输入和输出:SciPy.io
  • 4.3 特殊函数:SciPy.special
  • 4.4 线性代数操作:SciPy.linalg
  • 4.5 快速傅里叶变换:sipy.fftpack
  • 4.6 优化器:SciPy.optimize
  • 4.7 统计工具:SciPy.stats
  • 4.8 SciPy实例
  • 4.9 本章小结
  • 第5章 大数据分析工具:Matplotlib
  • 5.1 初级绘制
  • 5.2 图像、子区、子图、刻度
  • 5.3 其他种类的绘图
  • 5.4 本章小结
  • 第6章 大数据分析工具:Pandas
  • 6.1 Pandas系列
  • 6.2 Pandas数据帧
  • 6.3 Pandas面板
  • 6.4 Pandas快速入门
  • 6.5 本章小结
  • 第7章 大数据分析工具:Statsmodels与Gensim
  • 7.1 Statsmodels
  • 7.2 Gensim
  • 7.3 本章小结
  • 第8章 大数据分析算法与实例
  • 8.1 描述统计
  • 8.2 假设检验
  • 8.3 信度分析
  • 8.4 列联表分析
  • 8.5 相关分析
  • 8.6 方差分析
  • 8.7 回归分析
  • 8.8 聚类分析
  • 8.9 判别分析
  • 8.10 主成分分析
  • 8.11 因子分析
  • 8.12 时间序列分析
  • 8.13 生存分析
  • 8.14 典型相关分析
  • 8.15 RoC分析
  • 8.16 距离分析
  • 8.17 对应分析
  • 8.18 决策树分析
  • 8.19 神经网络—深度学习
  • 8.20 蒙特·卡罗模拟
  • 8.21 关联规则
  • 8.22 Uplift Modeling
  • 8.23 集成方法
  • 8.24 异常检测
  • 8.25 文本挖掘
  • 8.26 Boosting算法(提升法和Gradient Boosting)
  • 8.27 本章小结
  • 参考文献
展开全部