作品简介

近年来,R语言可谓是数据分析的热门语言,相关的资料五花八门,让读者难以抉择。本书简洁、精练,以理论与实践相结合的方式让大家快速掌握R语言。

全书共14章,第1章为绪论,从数学、统计学和逻辑学3个方面探讨了树立正确数据思维的一些原则。其余各章分为基础篇(第2~10章)、应用篇(第11、12章)和进阶篇(第13、14章)。基础篇按照数据分析过程,主要讨论了R的数据结构、数据导入/导出、数据清洗、数据变换、可视化、高级语言编程和常用建模方法。应用篇通过对2个经典案例的分析,使读者能够把学到的R基础知识应用到解决实际问题中,把数据变成价值。进阶篇解决如何用R处理大数据的一些关键技术。

本书可用作培养应用型人才的课程教材,也可作为数据分析爱好者的参考资料。

程显毅,1956年12月生,哈尔滨人,教授,博士,现任中国人工智能学会知识工程专委会委员、江苏省微电脑学会人工智能专委会副主任委员、江苏省人工智能学会监事、江苏省大数据专家委员会委员、江苏省云计算论坛专家委员会委员。

作品目录

  • 内容简介
  • 总主编简介
  • 本书主编简介
  • 总 序
  • 前 言
  • 第1章 绪 论
  • 1.1 为什么学习R语言
  • 1.2 正确的数据思维观
  • 习题
  • 基础篇
  • 第2章 R语言入门
  • 2.1 新手上路
  • 2.2 R语言开发环境部署
  • 2.3 获取帮助
  • 2.4 工作空间
  • 2.5 脚本
  • 2.6 R包
  • 习题
  • 第3章 数据类型
  • 3.1 变量与常量
  • 3.2 结构类型
  • 3.3 字符串操作
  • 3.4 用于数据处理和转换的常用函数
  • 习题
  • 第4章 数据准备
  • 4.1 数据导入
  • 4.2 数据导出
  • 习题
  • 第5章 数据可视化
  • 5.1 低水平绘图命令
  • 5.2 高水平绘图命令
  • 5.3 交互式绘图命令
  • 习题
  • 第6章 数据探索
  • 6.1 缺失值分析
  • 6.2 异常值分析
  • 6.3 不一致值分析
  • 6.4 数据的统计特征分析
  • 习题
  • 第7章 数据变换
  • 7.1 数据清洗
  • 7.2 数据选择
  • 7.3 数据集成
  • 习题
  • 第8章 高级编程
  • 8.1 控制结构
  • 8.2 用户自定义函数
  • 习题
  • 第9章 数据建模
  • 9.1 Rattle包
  • 9.2 聚类模型
  • 9.3 关联分析模型
  • 9.3.4 Apriori算法
  • 9.4 传统决策树模型
  • 9.5 随机森林决策树模型
  • 9.6 自适应选择决策树模型
  • 9.7 SVM
  • 9.8 线性回归模型
  • 9.9 神经网络模型
  • 习题
  • 第10章 模型评估
  • 10.1 数据集
  • 10.2 混淆矩阵
  • 10.3 风险图
  • 10.4 ROC曲线
  • 习题
  • 应用篇
  • 第11章 影响大学平均录取分数线因素分析
  • 11.1 背景与目标
  • 11.2 数据说明
  • 11.3 描述性分析
  • 11.4 总结与建议
  • 第12章 收视率分析
  • 12.1 背景介绍
  • 12.2 数据说明
  • 12.3 描述性分析
  • 12.4 总结与建议
  • 进阶篇
  • 第13章 RHadoop
  • 13.1 认识RHadoop
  • 13.2 RHadoop安装
  • 13.3 综合练习
  • 习题
  • 第14章 SparkR
  • 14.1 认识SparkR
  • 14.2 SparkDataFrame
  • 14.3 SparkR支持的机器学习算法
  • 14.4 综合练习
  • 习题
  • 参考文献
  • 附录 大数据和人工智能实验环境
  • 附录CD
展开全部