作品简介

进入互联网时代后,网络舆情形成迅速,影响着社会生活的方方面面,如何高效全面地采集舆情数据并利用数据挖掘算法及数据分析工具将舆情文本中有价值的信息挖掘出来,对于舆情监管、舆情研判、舆情引导至关重要。本书以R语言作为舆情分析的工具,在阐述相关原理的基础上,介绍了网络舆情信息采集、舆情信息预处理、舆情文本分类、舆情文本聚类、舆情数据关联规则挖掘、舆情相关指标预测等舆情分析环节,所有分析都使用R语言进行实现,给出了完整的过程和代码。

本书可以作为舆情处理、数据分析等教学或科研的技术参考书,适于本科生、研究生、数据分析爱好者、舆情分析工作者及研究人员等阅读参考。

作品目录

  • 内容简介
  • 前言
  • 第1章 网络舆情与舆情分析概述
  • 1.1 舆情与网络舆情的基本概念
  • 1.1.1 舆情的起源及定义
  • 1.1.2 网络舆情
  • 1.2 网络舆情的特征及表现形式
  • 1.3 网络舆情分析技术
  • 1.3.1 网络舆情分析的研究热点
  • 1.3.2 网络舆情分析的步骤
  • 1.3.3 网络舆情分析的常用技术
  • 第2章 R语言基础
  • 2.1 R语言简介
  • 2.1.1 R语言的起源、特点及安装
  • 2.1.2 R语言的基本操作
  • 2.1.3 R语言的常用命令
  • 2.1.4 包的安装与加载
  • 2.2 数据操作
  • 2.2.1 基本数据类型
  • 2.2.2 数据结构
  • 2.2.3 数据读写
  • 2.2.4 数据的描述性统计
  • 2.3 R语言语法
  • 2.3.1 分支结构
  • 2.3.2 循环结构
  • 2.3.3 R语言函数
  • 2.3.4 apply函数族
  • 2.4 R语言绘图
  • 2.4.1 条形图
  • 2.4.2 饼图
  • 2.4.3 直方图
  • 2.4.4 散点图
  • 第3章 网络舆情信息采集及R爬虫的实现
  • 3.1 网络舆情信息采集的基本原理
  • 3.1.1 网络爬虫及其主要类型
  • 3.1.2 爬虫的工作流程
  • 3.2 免费的网络舆情采集利器——八爪鱼数据采集器
  • 3.2.1 简介
  • 3.2.2 下载、安装、启动与注册账号
  • 3.2.3 八爪鱼采集器的使用
  • 3.3 基于R语言的信息采集爬虫的开发
  • 3.3.1 HTTP
  • 3.3.2 RCurl包
  • 3.3.3 XML包
  • 3.3.4 基于RCurl包与XML包的爬虫示例
  • 第4章 基于R语言的舆情信息预处理
  • 4.1 分词处理
  • 4.1.1 分词的基本原理
  • 4.1.2 使用Rwordseg包进行分词
  • 4.1.3 使用jiebaR包进行分词
  • 4.2 去停用词
  • 4.2.1 什么是停用词
  • 4.2.2 R语言中去停用词的方法
  • 4.3 词频统计
  • 4.3.1 词频统计常用函数
  • 4.3.2 词云可视化
  • 4.4 文本向量化
  • 4.4.1 语料库与文本向量空间
  • 4.4.2 R语言中语料库的构建
  • 4.4.3 R语言中文本向量的构建——文档词条矩阵
  • 第5章 基于R语言的网络舆情分类
  • 5.1 分类的定义及其基本原理
  • 5.1.1 分类的定义
  • 5.1.2 分类的基本原理
  • 5.2 经典的分类算法——决策树算法
  • 5.2.1 什么是决策树
  • 5.2.2 决策树算法的基本思想
  • 5.3 分类算法在舆情分析中的应用
  • 5.3.1 网络舆情分类的基本原理
  • 5.3.2 网络舆情分类的常用算法及其R语言实现
  • 5.4 基于R语言的网络舆情分类示例——微信公众号文章分类
  • 5.4.1 问题描述
  • 5.4.2 数据采集
  • 5.4.3 微信公众号文章分类的R语言实现
  • 第6章 基于R语言的网络舆情热点话题聚类
  • 6.1 聚类的定义及其基本原理
  • 6.1.1 聚类的定义
  • 6.1.2 聚类的基本原理
  • 6.2 经典的聚类算法
  • 6.2.1 K-Means聚类
  • 6.2.2 层次聚类
  • 6.3 聚类算法在舆情分析中的应用及其R语言实现
  • 6.4 基于R语言的网络舆情聚类分析示例——电商顾客评论热点话题聚类
  • 6.4.1 问题描述
  • 6.4.2 数据采集
  • 6.4.3 电商商品评论聚类分析的R语言实现
  • 第7章 基于R语言的网络舆情关联规则挖掘
  • 7.1 关联规则挖掘的定义及其基本原理
  • 7.1.1 什么是关联规则挖掘
  • 7.1.2 关联规则挖掘的基本原理
  • 7.2 常用的关联规则挖掘算法
  • 7.2.1 Apriori算法
  • 7.2.2 Eclat算法
  • 7.3 关联规则挖掘在舆情分析中的应用及其R语言实现
  • 7.4 基于R语言的网络舆情关联分析示例——雾霾舆情热点词关联模式挖掘
  • 7.4.1 问题描述
  • 7.4.2 数据采集
  • 7.4.3 雾霾舆情热点词关联模式挖掘的R语言实现
  • 第8章 基于R语言与BP神经网络的网络舆情分析
  • 8.1 BP神经网络概述
  • 8.1.1 什么是人工神经网络
  • 8.1.2 什么是BP神经网络
  • 8.2 BP神经网络的算法原理
  • 8.2.1 BP神经网络的算法流程
  • 8.2.2 数据的归一化处理
  • 8.3 BP神经网络在舆情分析中的应用及其R语言实现
  • 8.4 基于R语言与神经网络的舆情分析示例——微博转发数与评论数预测
  • 8.4.1 问题描述
  • 8.4.2 数据采集
  • 8.4.3 基于R语言与神经网络的微博转发数与评论数预测的实现
  • 参考文献
展开全部