首页
电子书
读书
大书架
首页
读书
经济管理
大数据分析
书名
大数据分析
作者
尚硅谷IT教育
格式
PDF
ISBN书号
9787121396007
出版年
2020-11
出版社
电子工业出版社
页数
386
定价
100.00
装帧
平装
标签
技术
大数据
数据分析
数据管理
陈老师
高
知识星球
数仓
豆瓣评论
L小姐
嗯……怎么说呢,是一本翻开满页都是代码的书
2022-03-14
中华有神功
2021-71 详细的数仓搭建 业务数据mysql,用户行为数据nginx负载均衡打到日志服务器,以文件形式落盘到日志服务器上。保存30天用flume来监控日志里,实时采集日志信息。Kafka:1很多人在使用,生态很完备2 可以高效读写 A有分区概念,多分区之间可以并行读写 B page cache C 顺序读写基于kimball的维度建模:ods:3件事,保持数据原貌、创建分区表、采用压缩dwd:第1步选择业务过程,第2步声明力度,第3步确定维度,第4步确定事实 数据清洗、脱敏、压缩、列式存储 dws:2件事,站在维度看事实,看事实表的度量值 dwt:和dws一样,两件事。开始日期?结束日期?从开始到结束累计发生的度量值,以及最近一段时间累计发生的度量值ads多个指标 结尾可视化展示
2021-07-17
热门推荐
1
我人生最开始的好朋友
2
西方文明4000年
3
不被大风吹倒
4
草民
5
她的秘密人生
6
萧关道
7
我脑子里的不速之客
8
时间贫困
9
中国石窟简史
10
有生
豆瓣评论