概念:又称数据集市或宽表。按照业务划分,如流量、订单、用户等,生成字段比较多的宽表,用于提供后续的业务查询,OLAP分析,数据分发等。 数据生成方式:由轻度汇总层和明细层数据计算生成。 日志存储方式:使用impala内表,parquet文件格式。 日志删除方式:长久存储。 表schema:一般按天创建分区,没有时间概念的按具体业务选择分区字段。 库与表命名。库名:dm,表名:初步考虑格式为:dm日期业务表名,待定。 旧数据更新方式:直接覆盖
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。