作品简介

大数据这个概念自诞生以来,已经经历了几次飞跃。时至今日,大数据这个名词频繁地与人工智能、DT、预测等词汇放在一起,看上去数据的发展已经成为与科技发展甚至整个社会发展平行的存在——一切的颠覆都离不开数据。大数据是一种赋能工具,它的作用是帮助行业加速价值的流通,减少信息不对称,提高交易效率。

本书定义为“轻教材”,并结合国内先进的大数据公司的实战经验,帮助大数据从业人员熟悉大数据相关的基础知识、基本工具,帮助大数据企业的管理者建立数据驱动的文化和构建团队。此书将成为大数据从业人员、大数据企业管理人员以及大数据领域的投资者、监管者的必备参考书籍。

作品目录

  • 前言
  • 第一篇 大数据基础知识
  • 第1章 大数据的基本定义
  • 1.1 大数据分析的出现
  • 1.2 大数据如何发掘价值
  • 1.3 大数据处理的关键——数据类型
  • 1.4 大数据处理的微妙之处
  • 1.5 大数据环境下的处理分析工具
  • 1.6 智能数据时代到来
  • 第2章 数据的艺术
  • 2.1 评估可能性的艺术
  • 2.2 了解现状
  • 2.3 自我评估、完善度、信息架构
  • 2.4 愿景部署
  • 2.5 现在和将来的数据仓库
  • 2.6 实时建议和操作
  • 2.7 验证提出的愿景
  • 第3章 大数据:有所为有所不为
  • 3.1 大数据分析最佳实践
  • 3.2 从小做起
  • 3.3 关注大局
  • 3.4 避免最差实践
  • 3.5 步步为营
  • 3.6 学会利用异常数据
  • 3.7 速度与精度的抉择
  • 3.8 内存计算
  • 第二篇 大数据工具和技术
  • 第4章 分布式世界中的设计
  • 4.1 可见性
  • 4.2 保持简单的重要性
  • 4.3 组合
  • 4.4 分布式状态
  • 4.5 CAP原则
  • 4.6 松耦合系统
  • 4.7 速度
  • 4.8 总结
  • 第5章 大数据分析工具
  • 5.1 Apache Hadoop
  • 5.2 Apache Spark
  • 5.3 NoSQL数据库
  • 5.4 MongoDB
  • 第三篇 数据管理
  • 第6章 大数据的类型
  • 6.1 定义结构化数据
  • 6.2 探秘结构化数据来源
  • 6.3 关系数据库在大数据中扮演的角色
  • 6.4 非结构化数据
  • 6.5 内容管理系统在大数据管理中的作用
  • 6.6 实时和非实时条件
  • 6.7 大数据集成
  • 第7章 大数据的新范式:我们想要从大数据系统中获得什么
  • 7.1 稳定性和容错性
  • 7.2 横向扩容
  • 7.3 可扩展性
  • 7.4 即席查询
  • 7.5 最小化维护
  • 7.6 可调试性
  • 7.7 完全增量式架构
  • 7.8 操作复杂性
  • 7.9 极其复杂地实现最终一致性
  • 7.10 人为容错的缺陷
  • 7.11 Lambda架构
  • 第8章 数据管理
  • 8.1 数据管理成熟度评估
  • 8.2 元数据管理
  • 8.3 数据治理
  • 8.4 数据质量管理
  • 8.5 参考数据与主数据管理
  • 第四篇 数据工程
  • 第9章 理解数据业务流程
  • 9.1 理解商业动机
  • 9.2 调查计划
  • 9.3 初步研究
  • 9.4 专家咨询
  • 9.5 识别关键成功因素
  • 9.6 优先考虑早期路线图的执行
  • 9.7 战略图谱
  • 第10章 大数据和云计算
  • 10.1 云计算的定义
  • 10.2 私有云与公有云计算
  • 10.3 IaaS典型平台——亚马逊云平台AWS
  • 10.4 PaaS典型平台
  • 10.5 SaaS典型平台
  • 第11章 数据收集
  • 11.1 收集一切
  • 11.2 为数据源设置优先级
  • 11.3 关联单独的数据
  • 11.4 如何收集数据
  • 11.5 数据采购
  • 11.6 数据保留
  • 第12章 数据质量和数据预处理
  • 12.1 数据质量:为什么要对数据做预处理
  • 12.2 数据预处理的主要工作
  • 第13章 数据安全和隐私
  • 13.1 数据收集:了解隐私的最前沿
  • 13.2 策略考虑因素
  • 13.3 实施考虑因素
  • 13.4 总结
  • 第五篇 数据科学
  • 第14章 数据分析
  • 14.1 什么是分析
  • 14.2 分析的类型
  • 第15章 数据探索
  • 15.1 概要
  • 15.2 数据探索的目标
  • 15.3 数据集
  • 15.4 描述性统计
  • 15.5 数据可视化
  • 15.6 数据探索路线图
  • 第16章 大数据、数据科学和数据挖掘
  • 16.1 先验知识
  • 16.2 数据准备
  • 16.3 建模
  • 16.4 应用
  • 16.5 总结
  • 第六篇 构筑数据驱动型企业
  • 第17章 建立数据驱动文化
  • 17.1 数据收集
  • 17.2 报告
  • 17.3 警报
  • 17.4 从报告到警报再到分析
  • 17.5 数据驱动的标志
  • 17.6 分析成熟度
  • 第18章 构建大数据团队
  • 18.1 数据科学家
  • 18.2 团队挑战
  • 18.3 不同的团队,不同的目标
  • 18.4 别忘了数据
  • 18.5 更多挑战
  • 18.6 团队与文化
  • 18.7 量化成就
  • 第七篇 大数据实战
  • 第19章 大数据使用实例
  • 19.1 大数据的使用与意义
  • 19.2 案例:大数据在金融领域的应用
  • 19.3 案例:大数据在地产领域的应用
  • 第20章 大数据分析和数据驱动决策的思维实战
  • 20.1 无处不在的数据机会
  • 20.2 数据科学、数据工程和数据驱动决策
  • 20.3 数据处理和大数据
  • 20.4 从大数据1.0到大数据2.0
  • 20.5 数据和数据科学能力作为战略资产
  • 20.6 数据分析思维
  • 20.7 具备数据分析技能的管理者
  • 20.8 数据挖掘与数据科学
  • 20.9 化学反应不只限于试管:数据科学与数据科学家的工作
  • 20.10 总结
  • 第21章 结语
  • 21.1 全面解读
  • 21.2 通往大数据之路
  • 21.3 思索大数据的真实一面
  • 21.4 大数据实践
  • 21.5 深度解读大数据处理流程
  • 21.6 大数据可视化
  • 21.7 大数据隐私
展开全部