作品简介

大数据时代,R语言已成为数据分 析的利器,是挖掘数据价值必不可少的工具,截止到2014年5月,R语言的软件包有5500多个。如何使用这众多的软件包,是R语言学习者和使用者遇到的最大问题。本书将告诉读者R语言在真实环境下到底能够做什么,并且详细地告诉你怎样一步一步地实施。书中结合作者的使用心得及案例分析,介绍了30多个R语言包,一定会解决R语言使用者的诸多困扰。

本书是R语言入门后的进阶读物,为用户灵活使用R语言提供思路上的扩展,给出进阶的学习路线。书中内容来自作者在R语言的实际使用过程中的经验总结,其中涉及计算机、互联网、数据库、大数据、统计、金融等领域,详细总结了R语言在实际使用时与Java、MySQL、Redis、MongoDB、Cassandra、Hadoop、Hive、HBase等技术的综合运用的解决方案,具有实战性、可操作性。从本书中,读者既可以看到R语言在各行业、各领域所散发的魅力,也能看到R语言在与其他计算机语言结合后所迸发的强大活力,解决在使用R语言过程中遇到的瓶颈;书中具有全局观的案例实施,也会给读者带来新的启发。

本书姊妹篇《R的极客理想——高级开发篇》将深入介绍R语言底层原理,并使用R语言开发出企业级的应用。

张丹 R语言资深用户,系统架构师,精通Java、JavaScript、Node.js等多种工具,曾开发多种不同类型的系统及应用,目前在量化投资领域创业中。张丹在其个人博客原创了大量关于R语言和Hadoop大数据技术的文章,2013年,他的RHadoop系列文章在统计之都发表。他还是Dataguru的培训讲师,教授课程《Hadoop应用开发实战案例》、《Mahout机器学习平台》。

博客:http://blog.fens.me

微博:http://weibo.com/dotabook,@Conan_Z

作品目录

  • 序一
  • 序二
  • 前言
  • 为什么要写这本书
  • 读者对象
  • 如何阅读本书
  • 勘误和支持
  • 致谢
  • 第一部分 R基础
  • 第1章 R语言基础包
  • 1.1 R是最值得学习的编程语言
  • 1.2 R的历史版本安装
  • 1.3 fortunes记录R语言的大智慧
  • 1.4 formatR代码自动化排版
  • 1.5 多人在线协作R开发RStudio Server
  • 1.6 R和JSON的傻瓜式编程
  • 1.7 R语言的高质量图形渲染库Cairo
  • 1.8 caTools:一个奇特的工具集
  • 第2章 时间序列基础包
  • 2.1 R语言时间序列基础库zoo
  • 2.2 可扩展的时间序列xts
  • 2.3 时间序列可视化plot.xts
  • 第3章 R性能监控包
  • 3.1 R语言本地缓存工具memoise
  • 3.2 R语言性能监控工具Rprof
  • 3.3 R语言性能可视化工具lineprof
  • 第二部分  R服务器
  • 第4章 R语言的跨平台通信
  • 4.1 Rserve与Java的跨平台通信
  • 4.2 Rsession让Java调用R更简单
  • 4.3 解惑rJava R与Java的高速通道
  • 4.4 Node.js与R跨平台通信
  • 第5章 R的服务器实现
  • 5.1 R语言服务器程序Rserve详解
  • 5.2 Rserve的R语言客户端RSclient
  • 5.3 FastRWeb:跑在Web上的R程序
  • 5.4 R语言构建Websocket服务器
  • 第三部分 数据库和大数据
  • 第6章 数据库和NoSQL
  • 6.1 RMySQL数据库编程指南
  • 6.2 R利剑NoSQL 之MongoDB
  • 6.3 R利剑NoSQL之Redis
  • 6.4 R利剑NoSQL之Cassandra
  • 6.5 R利剑NoSQL之Hive
  • 6.6 用RHive从历史数据中提取逆回购信息
  • 第7章 RHadoop
  • 7.1 R语言为Hadoop注入统计血脉
  • 7.2 RHadoop安装与使用
  • 7.3 RHadoop实验:统计邮箱出现次数
  • 7.4 RHadoop实现基于MapReduce的协同过滤算法
  • 7.5 rHBase安装与使用
  • 7.6 解决RHadoop安装错误:PipeMapRed.waitOutputThreads()
  • 第四部分 附录
  • 附录A Java环境安装
  • A.1 Java在Windows中安装
  • A.2 Java在Linux Ubuntu中安装
  • 附录B MySQL数据库安装
  • B.1 MySQL在Windows中安装
  • B.2 MySQL在Linux Ubuntu中安装
  • B.3 通过命令行客户端访问MySQL
  • B.4 修改MySQL服务器的配置
  • 附录C Redis数据库安装
  • C.1 Redis在Windows中安装
  • C.2 Redis在Linux Ubuntu中安装
  • C.3 通过命令行客户端访问Redis
  • C.4 修改Redis的配置
  • 附录D MongoDB数据库安装
  • D.1 MongoDB在Windows中安装
  • D.2 MongoDB在Linux Ubuntu中安装
  • D.3 通过命令行客户端访问MongoDB
  • 附录E Cassandra数据库安装
  • E.1 在Ubuntu中环境准备
  • E.2 下载Cassandra软件包
  • E.3 配置Cassandra
  • E.4 设置环境变量
  • E.5 启动Cassandra服务器
  • E.6 用客户端访问cassandra
  • 附录F Hadoop安装
  • F.1 在Ubuntu中环境准备
  • F.2 找到Hadoop历史版本
  • F.3 用源代码构建Hadoop环境
  • F.4 快速Hadoop配置环境脚本
  • F.5 为Windows环境编译hadoop-core.jar
  • 附录G Hive环境安装
  • G.1 Hive的安装
  • 附录H HBase安装
  • H.1 在Ubuntu中环境准备
  • H.2 HBase安装
  • H.3 Thrift安装
展开全部