就拿订单表来说,一个模型中的dws的粒度应该怎么确定呢?说dws比dwd会涉及聚合,但是究竟是商品粒度的,地域粒度的还是时间年月周等的。 然后按照这个逻辑,dws往往是多个的,一个dwd对应多个dws,然后一个dws又对应一个或者多个数据集市
个人认为,对于数仓模型中的DWS层,其粒度应该由业务定义,根据业务需求来确定。在订单表这个例子中,DWS的粒度可以根据不同业务场景来确定,比如可以按照商品粒度、地域粒度或时间年月周等来进行聚合。
在确定DWS的粒度时,需要考虑业务的实际情况和分析需求,同时还需要考虑数据的存储和计算效率。一般来说,DWS的粒度应该较为细致,以满足更细粒度的分析需求,但也需要权衡存储和计算效率,避免过度冗余数据和计算资源浪费。
在实际应用中,一个DWD层可能对应多个DWS层,不同的DWS层可以按照不同的粒度进行聚合和加工,以满足不同的业务需求。同时,不同的DWS层也可以对应一个或多个数据集市,以便更好地支持业务分析和决策。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。