作品简介

本书以大学生大数据技能竞赛、“智警杯”大数据技能竞赛为背景,全面系统地讲述了大数据技术的基本原理和应用。

本书共5章,主要介绍了Linux操作系统的常用命令和服务的使用;MySQL数据库操作与管理、非关系型数据库NoSQL;围绕大数据框架讲述了Hadoop技术、Hive数据仓库等大数据组件架构的应用;数据采集与分析;数据挖掘与数据可视化、业务分析报告撰写等内容。

本书内容循序渐进,条理性强,全部内容基于项目需求进行设计,同时对所需的系统环境、软件版本、数据等信息进行详细说明,有助于读者本地环境的复现和练习。

为提升学习效果,书中结合实际应用提供了大量的案例,并配以完善的学习资料,包括课件、软件、数据、源码、答案、在线竞赛模拟平台,为读者带来全方位的学习体验。扫描关注机械工业出版社计算机分社官方微信订阅号IT有得聊,回复“73112”。即可获取本书配套资源下载链接。

本书既可作为大数据技能竞赛的参赛辅导书,也可作为高等院校本、专科数据科学与大数据技术以及其他计算机相关专业大数据技术综合实训教材。

李辉,博士,中国农业大学计算中心兼农业大数据实验室主任,全国大学生大数据技能竞赛、全国高校大数据能力提升大赛等大数据类赛项裁判长,中国大数据技术与应用联盟智库专家,市大数据教学实践基地负责人;曾获中国大数据学术创新奖、全国高校人工智能与大数据教学创新奖;主讲“数据库原理及应用基础”“Python语言程序设计”“大数据可视化分析”等本科生课程;主持新工科项目2项,发表学术论文20多篇,申请软件著作权50多项,专利3项;出版《数据库系统原理及MySQL应用教程》教材第1版和第2版被国内众多院校选用,为机械工业出版社计算机分社20周年金牌作者。

作品目录

  • 前言
  • 实验环境配置说明
  • 第1章 Linux操作系统
  • 1.1 主机名配置
  • 1.2 防火墙配置与管理
  • 1.3 时间同步
  • 1.4 定时任务管理
  • 1.5 SSH远程访问
  • 1.6 软件包管理
  • 思考与练习
  • 第2章 数据库技术
  • 2.1 MySQL数据库
  • 2.2 非关系型数据库NoSQL
  • 思考与练习
  • 第3章 大数据平台技术
  • 3.1 Hadoop分布式大数据框架
  • 3.2 Hive数据仓库
  • 3.3 HBase数据库
  • 3.4 Spark技术框架
  • 3.5 大数据平台运维与管理
  • 3.6 大数据框架应用
  • 思考与练习
  • 第4章 数据采集与分析
  • 4.1 报表数据处理
  • 4.2 网络信息获取技术
  • 4.3 数据统计分析
  • 思考与练习
  • 第5章 数据挖掘与数据可视化
  • 5.1 数据挖掘
  • 5.2 数据可视化
  • 5.3 业务分析报告撰写
  • 思考与练习
展开全部