作品简介

这是一本将数据分析技术与数据使用场景深度结合的著作,从实战角度讲解了如何利用Python进行数据分析和数据化运营。

畅销书全新、大幅升级,第1版近乎100%的好评,第2版不仅将Python升级到了*新的版本,而且对具体内容进行了大幅度的补充和优化。作者是有10余年数据分析与数据化运营的大数据专家,书中对50余个数据工作流知识点、14个数据分析与挖掘主题、4个数据化运营主题、8个综合性案例进行了全面的讲解,能让数据化运营结合数据使用场景360°落地。

全书一共9章,分为两个部分:

第一部分(第1—4章)Python数据分析与挖掘,首先介绍了Python和数据化运营的基本知识,然后详细讲解了Python数据获取(结构化和非结构化)、预处理、分析和挖掘的关键技术和经验,包含10大类预处理经验、14个数据分析与挖掘主题,50余个知识点。

第二部分(第5—9章)Python数据化运营,这是本书的核心,详细讲解了会员运营、商品运营、流量运营和内容运营4大主题,以及提升数据化运营价值的方法。每个运营主题中都包含了基本知识、评估指标、应用场景、数据分析模型、数据分析小技巧、数据分析大实话以及2个综合性的应用案例。

宋天龙,大数据技术专家,触脉咨询合伙人兼副总裁,前Webtrekk中国区技术和咨询负责人(Webtrekk,德国最大的在线数据分析服务提供商)。擅长数据挖掘、建模、分析与运营,精通端到端数据价值场景设计、业务需求转换、数据结构梳理、数据建模与学习以及数据工程交付。在电子商务、零售、银行、保险等多个行业拥有丰富的数据项目工作经验,参与过集团和企业级数据体系规划、DMP与数据仓库建设、大数据产品开发、网站流量系统建设、个性化智能推荐与精准营销、企业大数据智能等。参与实施客户案例包括联合利华、Webpower、德国OTTO集团电子商务(中国)、Esprit中国、猪八戒网、顺丰优选、乐视商城、泰康人寿、酒仙网、国美在线、迪信通等。

著有多部畅销书:

《Python数据分析与数据化运营》

《网站数据挖掘与分析:系统方法与商业实践》

《企业大数据系统构建实战:技术、架构、实施与应用》

作品目录

  • 前言
  • 第1章 Python和数据化运营
  • 1.1 用Python做数据化运营
  • 1.2 数据化运营所需的Python相关工具和组件
  • 1.3 内容延伸:Python的OCR和tensorflow
  • 1.4 第1个用Python实现的数据化运营分析实例、销售预测
  • 1.5 本章小结
  • 第2章 数据化运营的数据来源
  • 2.1 数据化运营的数据来源类型
  • 2.2 使用Python获取运营数据
  • 2.3 内容延伸:读取非结构化网页、文本、图像、视频、语音
  • 2.4 本章小结
  • 第3章 10条数据化运营不得不知道的数据预处理经验
  • 3.1 数据清洗:缺失值、异常值和重复值的处理
  • 3.2 将分类数据和顺序数据转换为标志变量
  • 3.3 大数据时代的数据降维
  • 3.4 解决样本类别分布不均衡的问题
  • 3.5 数据化运营要抽样还是全量数据
  • 3.6 解决运营数据的共线性问题
  • 3.7 有关相关性分析的混沌
  • 3.8 标准化,让运营数据落入相同的范围
  • 3.9 离散化,对运营数据做逻辑分层
  • 3.10 内容延伸:非结构化数据的预处理
  • 3.11 本章小结
  • 第4章 跳过运营数据分析和挖掘的“大坑”
  • 4.1 聚类分析
  • 4.2 回归分析
  • 4.3 分类分析
  • 4.4 关联分析
  • 4.5 异常检测分析
  • 4.6 时间序列分析
  • 4.7 路径、漏斗、归因和热力图分析
  • 4.8 其他数据分析和挖掘的忠告
  • 4.9 内容延伸1:非结构化数据的分析与挖掘
  • 4.10 内容延伸2:AutoML——自动化数据挖掘与机器学习
  • 4.11 本章小结
  • 第5章 会员数据化运营
  • 5.1 会员数据化运营概述
  • 5.2 会员数据化运营关键指标
  • 5.3 会员数据化运营应用场景
  • 5.4 会员数据化运营分析模型
  • 5.5 会员数据化运营分析小技巧
  • 5.6 会员数据化运营分析的“大实话”
  • 5.7 案例:基于RFM的精细化用户管理
  • 5.8 案例:基于嵌套Pipeline和FeatureUnion复合数据工作流的营销响应预测
  • 5.9 本章小结
  • 第6章 商品数据化运营
  • 6.1 商品数据化运营概述
  • 6.2 商品数据化运营关键指标
  • 6.3 商品数据化运营应用场景
  • 6.4 商品数据化运营分析模型
  • 6.5 商品数据化运营分析小技巧
  • 6.6 商品数据化运营分析的“大实话”
  • 6.7 案例:基于Gradient Boosting的自动超参数优化的销售预测
  • 6.8 案例:基于集成算法GBDT和RandomForest的投票组合模型的异常检测
  • 6.9 本章小结
  • 第7章 流量数据化运营
  • 7.1 流量数据化运营概述
  • 7.2 八大流量分析工具
  • 7.3 流量采集分析系统的工作机制
  • 7.4 流量数据与企业数据的整合
  • 7.5 流量数据化运营指标
  • 7.6 流量数据化运营应用场景
  • 7.7 流量数据化运营分析模型
  • 7.8 流量数据化运营分析小技巧
  • 7.9 流量数据化运营分析的“大实话”
  • 7.10 案例:基于自动节点树的数据异常原因下探分析
  • 7.11 案例:基于自动K值的KMeans广告效果聚类分析
  • 7.12 本章小结
  • 第8章 内容数据化运营
  • 8.1 内容数据化运营概述
  • 8.2 内容数据化运营指标
  • 8.3 内容数据化运营应用场景
  • 8.4 内容数据化运营分析模型
  • 8.5 内容数据化运营分析小技巧
  • 8.6 内容数据化运营分析的“大实话”
  • 8.7 案例:基于潜在狄利克雷分配的内容主题挖掘
  • 8.8 案例:基于多项式贝叶斯的增量学习的文本分类
  • 8.9 本章小结
  • 第9章 数据化运营分析的终极秘籍
  • 9.1 撰写出彩的数据分析报告的5个建议
  • 9.2 数据化运营支持的4种扩展方式
  • 9.3 提升数据化运营价值度的5种途径
  • 9.4 本章小结
  • 附录
  • 附录A 公开数据集
  • 附录B Python数据工具箱
展开全部