作品简介

掌握一门语言、一种工具已不足以应对当今的数据分析任务,本书旨在解决这一问题,针对了解R但不熟悉Python(或了解Python但不熟悉R)的从业人员,详解讲解了两种语言的编程技巧和转换方法,提供大量实战案例,不讨论理论细节。

A.奥利(A.Ohri),数据科学家,访问量超过100万次的知名博主。他曾为多家创业公司提供咨询服务,涉及的领域包括数据分析服务、数据分析教育和数据项目外包等。目前的研究兴趣涵盖开源分析、社交媒体分析、云计算交互等。他还著有《R for Business Analytics》和《R for Cloud Computing》。

作品目录

  • 译者序
  • 前言
  • 第1章 Python、R和R数据科学简介
  • 1.1 什么是Python
  • 1.2 什么是R
  • 1.3 什么是数据科学
  • 1.4 数据科学家的未来
  • 1.5 什么是大数据
  • 1.6 商务分析与数据科学
  • 1.7 数据科学家可用的工具
  • 1.8 用于数据科学的Python添加包
  • 1.9 Python和R之间的异同
  • 1.10 教程
  • 1.11 同时使用R和Python
  • 1.12 其他软件和Python
  • 1.13 将SAS与Jupyter一起使用
  • 1.14 如何将Python和R用于大数据分析
  • 1.15 什么是云计算
  • 1.16 如何在云上使用Python和R
  • 1.17 Python和R商业版本及其他替代版本
  • 1.18 数据驱动的决策
  • 参考文献
  • 第2章 数据输入
  • 2.1 pandas中的数据输入
  • 2.2 网页抓取数据输入
  • 2.3 来自RDBMS的数据输入
  • 第3章 数据检查和数据质量
  • 3.1 数据格式
  • 3.2 数据质量
  • 3.3 数据检查
  • 3.4 数据选择
  • 3.5 R中的数据检查
  • 参考文献
  • 第4章 探索性数据分析
  • 4.1 根据分析分组
  • 4.2 数值数据
  • 4.3 分类数据
  • 第5章 统计建模
  • 5.1 回归的概念
  • 5.2 相关关系不是因果关系
  • 5.3 R和Python中的线性回归
  • 5.4 R和Python中的Logistic回归
  • 参考文献
  • 第6章 数据可视化
  • 6.1 数据可视化的概念
  • 6.2 Tufte关于数据可视化的工作
  • 6.3 Stephen Few关于仪表盘的设计
  • 6.4 基本绘图
  • 6.5 高级绘图
  • 6.6 交互式绘图
  • 6.7 空间分析
  • 6.8 R中的数据可视化
  • 参考文献
  • 第7章 机器学习变得更容易
  • 7.1 删除最终决策树模型中不需要的列
  • 7.2 时间序列
  • 7.3 关联分析
  • 7.4 清洗语料库并制作词袋
  • 第8章 结论和总结
展开全部