作品简介

本书围绕使用R进行数据科学编程所需的实际步骤展开。全书着眼于该主题,介绍了有关该主题的工具和技术的整个生态系统。虽然编写代码是成为数据科学家的核心部分,但获得更多的基础技能也是这个过程中必不可少的。数据科学要安装和配置软件以编写、执行和管理代码,跟踪项目版本变动,利用计算机科学的核心概念来理解如何完成给定任务,访问并处理各种不同来源的数据,利用可视化手段来揭示数据中的模式,构建与他人共享观点的应用程序。本书的目的是帮助人们在这些领域打下坚实基础,以便能进入数据科学领域(或将数据科学引入他们工作的领域中)。

本书作者迈克尔·弗里曼(Michael Freeman)、乔尔·罗斯(Joel Ross),译者张燕妮。

作品目录

  • 译者序
  • 前言
  • 第一部分 开始
  • 第1章 设置计算机
  • 1.1 设置命令行工具
  • 1.2 安装git
  • 1.3 创建GitHub账户
  • 1.4 选择一个文本编辑器
  • 1.5 下载R语言
  • 1.6 下载RStudio
  • 第2章 使用命令行
  • 2.1 访问命令行
  • 2.2 浏览文件系统
  • 2.3 管理文件
  • 2.4 错误处理
  • 2.5 重定向输出
  • 2.6 网络命令
  • 第二部分 项目管理
  • 第3章 使用git和GitHub进行版本控制
  • 3.1 什么是git
  • 3.2 配置和项目设置
  • 3.3 跟踪项目变更
  • 3.4 在GitHub中存储项目
  • 3.5 访问项目历史
  • 3.6 忽略项目中的文件
  • 第4章 使用Markdown制作文档
  • 4.1 编写Markdown
  • 4.2 渲染Markdown
  • 第三部分 R的基本技能
  • 第5章 R语言
  • 5.1 用R编程
  • 5.2 运行R代码
  • 5.3 注释
  • 5.4 变量定义
  • 5.5 获取帮助
  • 第6章 函数
  • 6.1 什么是函数
  • 6.2 内置R函数
  • 6.3 加载函数
  • 6.4 编写函数
  • 6.5 使用条件语句
  • 第7章 向量
  • 7.1 什么是向量
  • 7.2 向量化操作
  • 7.3 向量索引
  • 7.4 向量过滤
  • 7.5 向量修改
  • 第8章 列表
  • 8.1 什么是列表
  • 8.2 创建列表
  • 8.3 访问列表元素
  • 8.4 修改列表
  • 8.5 lapply()函数
  • 第四部分 数据清理
  • 第9章 理解数据
  • 9.1 数据生成过程
  • 9.2 查找数据
  • 9.3 数据类型
  • 9.4 解释数据
  • 9.5 用数据回答问题
  • 第10章 数据框
  • 10.1 什么是数据框
  • 10.2 使用数据框
  • 10.3 使用CSV数据
  • 第11章 使用dplyr操作数据
  • 11.1 操作数据语法
  • 11.2 核心dplyr函数
  • 11.3 执行顺序操作
  • 11.4 按组分析数据框
  • 11.5 连接数据框
  • 11.6 dplyr实战:分析飞行数据
  • 第12章 使用tidyr重塑数据
  • 12.1 什么是“整洁”数据
  • 12.2 从列到行:gather()
  • 12.3 从行到列:spread()
  • 12.4 tidyr实战:探索教育统计
  • 第13章 访问数据库
  • 13.1 关系数据库概述
  • 13.2 体验SQL
  • 13.3 从R访问数据库
  • 第14章 访问Web API
  • 14.1 什么是Web API
  • 14.2 RESTful请求
  • 14.3 从R访问Web API
  • 14.4 处理JSON数据
  • 14.5 API实战:在西雅图寻找古巴食品
  • 第五部分 数据可视化
  • 第15章 设计数据可视化
  • 15.1 可视化的目的
  • 15.2 选择可视化布局
  • 15.3 选择有效的图形编码
  • 15.4 数据显示的表达力
  • 15.5 强化美学
  • 第16章 使用ggplot2创建可视化
  • 16.1 图形语法
  • 16.2 使用ggplot2进行基本绘图
  • 16.3 复杂的布局及定制
  • 16.4 构建地图
  • 16.5 ggplot2实战:绘制旧金山驱逐地图
  • 第17章 R中的交互式可视化
  • 17.1 plotly包
  • 17.2 rbokeh包
  • 17.3 leaflet包
  • 17.4 交互式可视化实战:展示西雅图的变化
  • 第六部分 构建和共享应用程序
  • 第18章 使用R Markdown创建动态报告
  • 18.1 设置报告
  • 18.2 集成Markdown与R代码
  • 18.3 在报告中渲染数据与可视化
  • 18.4 以网站形式共享报告
  • 18.5 R Markdown实战:寿命预测报告
  • 第19章 使用Shiny构建交互式Web应用程序
  • 19.1 Shiny框架
  • 19.2 设计用户界面
  • 19.3 开发应用程序服务器
  • 19.4 发布Shiny应用程序
  • 19.5 Shiny实战:可视化警察致命射击
  • 第20章 协同工作
  • 20.1 使用分支跟踪代码的不同版本
  • 20.2 使用特性分支开发项目
  • 20.3 使用集中工作流协作
  • 20.4 使用分叉工作流协作
  • 第21章 继续学习
  • 21.1 统计学习
  • 21.2 其他编程语言
  • 21.3 道德准则
展开全部