作品简介

如何从数据中挖掘价值?一是要锻炼数据思维;二是需要选择一个便利快捷的工具。R语言在数据分析方面有着灵活、高效的优势。本书以R语言为基础,深度讲解从数据思维到实战的全过程。在章节组织上,本从R语言简介及优势入手,再到数据读取、清洗、描述、建模等数据分析的各个环节,由浅入深逐个讲解,是一本实务分析中的“R语言指南”。同时,本书采用大量实际案例辅以说明,既有助于上手分析,也可用于教学使用。

朱雪宁,复旦大学大数据学院助理教授。博士毕业于北京大学光华管理学院商务统计系,后于宾州州立大学(Pennsylvania State University)从事博士后研究工作。狗熊会创始团队成员、《R语千寻》专栏负责人;统计之都核心成员、编辑部主编。研究上关注社交网络数据分析、高维数据分析等问题。

作品目录

  • 推荐序一
  • 推荐序二
  • 前 言
  • 第1章/ChapterOne 初识R语言
  • 1.1 初识R语言
  • 1.2 安装R语言
  • 1.3 获取R帮助文档
  • 第2章/ChapterTwo R语言数据操作
  • 2.1 R中的数据类型
  • 2.2 数据读入
  • 第3章/ChapterThree R语言与统计分析
  • 3.1 描述分析及可视化
  • 3.2 统计检验
  • 3.3 回归分析
  • 3.4 代码规范与文档撰写
  • 第4章/ChapterFour R语言与非结构化数据分析
  • 4.1 文本分析
  • 4.2 图像分析
  • 第5章/ChapterFive R语言与机器学习
  • 5.1 机器学习概述
  • 5.2 数据预处理
  • 5.3 模型训练与调参
  • 5.4 模型训练与集成
  • 第6章/ChapterSix R语言爬虫初介
  • 6.1 HTML基础与R语言解析
  • 6.2 XML与XPath表达式以及R爬虫应用
  • 6.3 HTTP协议
  • 6.4 AJAX与网页动态加载
  • 6.5 正则表达式与字符串处理函数
  • 6.6 R语言爬虫实战
展开全部