作品简介

本书从企业实践出发,内容覆盖数据、平台、分析和应用等企业内数据流转的主要环节。布局上,按照数据与平台篇、分析篇和应用篇分别撰写。数据与平台篇(第1~3章),立足找到数据、整合数据、使用数据三个角度,介绍数据在企业内的分布和处理逻辑,以便快速为分析准备素材。分析篇(第4~11章),选取企业实际案例,介绍常用的数据挖掘与机器学习算法,以业务场景为导向展示数据分析过程和技巧。应用篇(第12~15章),选取当前主流的四个应用场景,介绍如何实现数据驱动,让数据“自动”流转于各个环节。

陈春宝,先后获得了经济学硕士和工业工程博士学位,拥有10年数据分析及应用经验,目前任职于股份制商业银行总行,在数据挖掘、机器学习和业务咨询方面有着独到的见解,他的工作跨大数据、营销、风险、运营等多个领域,擅长诊断各类业务问题,应用商业和数据分析手段获得创新性的解决方案,并帮助业务部门有效的实施。

他曾经担任交通银行信用卡中心的数据分析经理,以及美国MSA公司咨询顾问,拥有银行、信用卡、烟草、医药与电信等行业几十个项目的数据挖掘分析与SAS建模经验。基于大数据构建的预测模型,创新了商业模式并为公司带来新的收入来源,参与设计的算法获得人民银行科技发展二等奖。

他还长期负责企业内的数据分析人员培训和管理,并先后担任两个大数据专业期刊的责任编辑,近几年经常作为嘉宾活跃在高校与企业的一系列大数据活动中。曾担任上海交通大学工程硕士企业导师,SCI&EI索引期刊发表论文10余篇。

作品目录

  • 前言
  • 第一部分 数据与平台篇
  • 第1章 数据与数据平台
  • 1.1 数据的基本形态
  • 1.2 数据平台
  • 1.3 应用系统
  • 1.4 本章小结
  • 第2章 数据体系
  • 2.1 数据闭环
  • 2.2 数据缓冲区
  • 2.3 ETL
  • 2.4 作业调度
  • 2.5 监控和预警
  • 2.6 本章小结
  • 第3章 实战:打造数据闭环
  • 3.1 数据缓冲区的基本规则
  • 3.2 自动加载的流程
  • 3.3 自动加载程序的数据库设计
  • 3.4 自动加载程序的多线程实现
  • 3.5 本章小结
  • 第二部分 分析篇
  • 第4章 数据预处理
  • 4.1 数据表的预处理
  • 4.2 变量的预处理
  • 4.3 变量的设计
  • 4.4 变量筛选
  • 4.5 本章小结
  • 第5章 聚类,简单易用的客户细分方法
  • 5.1 从客户细分说起
  • 5.2 谱系聚类
  • 5.3 K-means算法
  • 5.4 本章小结
  • 第6章 关联规则挖掘,发现产品加载和交叉销售机会
  • 6.1 销售的真谛:让客户买得更多
  • 6.2 交叉销售
  • 6.3 关联规则挖掘,发现交叉销售机会
  • 6.4 案例:信用卡产品交叉销售
  • 6.5 本章小结
  • 第7章 社交网络分析,从“关系”的角度分析问题
  • 7.1 先看几张美轮美奂的图片
  • 7.2 社交网络分析方法
  • 7.3 案例:电商通过订单数据识别供应链
  • 7.4 案例:P2P投资风险防范
  • 7.5 本章小结
  • 第8章 线性回归,预测客户价值
  • 8.1 数值预测
  • 8.2 回归与拟合
  • 8.3 案例:信用卡客户价值预测
  • 8.4 基于客户价值分层的业务策略
  • 8.5 本章小结
  • 第9章 Logistic回归,精准营销的主要支撑算法
  • 9.1 大数据时代的精准营销
  • 9.2 Logistic回归算法介绍
  • 9.3 案例:信用卡消费信贷产品的精准营销
  • 9.4 预测模型的应用与评估
  • 9.5 本章小结
  • 第10章 决策树类算法,反欺诈模型“专家”
  • 10.1 决策树,重要的分类器
  • 10.2 决策树的关键思想
  • 10.3 案例:电商盗卡交易风险识别
  • 10.4 随机森林
  • 10.5 本章小结
  • 第11章 数据可视化,是分析更是设计
  • 11.1 数据演示之道
  • 11.2 个性化地图
  • 11.3 文本分析
  • 11.4 本章小结
  • 第三部分 应用篇
  • 第12章 标签系统
  • 12.1 认识标签系统
  • 12.2 标签系统的设计
  • 12.3 标签系统的实现
  • 12.4 本章小结
  • 第13章 数据自助营销平台
  • 13.1 数据自助营销平台的价值所在
  • 13.2 数据自助营销平台的实现原则
  • 13.3 数据自助营销平台的场景实例
  • 13.4 本章小结
  • 第14章 基于Mahout的个性化推荐系统
  • 14.1 Mahout的推荐引擎
  • 14.2 规模与效率
  • 14.3 实现一个推荐系统
  • 14.4 本章小结
  • 第15章 图计算与社会网络
  • 15.1 社会网络和属性图
  • 15.2 Spark GraphX与Neo4j
  • 15.3 使用Spark GraphX和Neo4j处理社会网络
  • 15.4 本章小结
展开全部