开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

关于数仓模型,对于dws的粒度是否是应该由业务定义

就拿订单表来说,一个模型中的dws的粒度应该怎么确定呢?说dws比dwd会涉及聚合,但是究竟是商品粒度的,地域粒度的还是时间年月周等的。 然后按照这个逻辑,dws往往是多个的,一个dwd对应多个dws,然后一个dws又对应一个或者多个数据集市

展开
收起
离原 2023-03-14 19:41:52 389 0
1 条回答
写回答
取消 提交回答
  • 随心分享,欢迎友善交流讨论:)

    个人认为,对于数仓模型中的DWS层,其粒度应该由业务定义,根据业务需求来确定。在订单表这个例子中,DWS的粒度可以根据不同业务场景来确定,比如可以按照商品粒度、地域粒度或时间年月周等来进行聚合。

    在确定DWS的粒度时,需要考虑业务的实际情况和分析需求,同时还需要考虑数据的存储和计算效率。一般来说,DWS的粒度应该较为细致,以满足更细粒度的分析需求,但也需要权衡存储和计算效率,避免过度冗余数据和计算资源浪费。

    在实际应用中,一个DWD层可能对应多个DWS层,不同的DWS层可以按照不同的粒度进行聚合和加工,以满足不同的业务需求。同时,不同的DWS层也可以对应一个或多个数据集市,以便更好地支持业务分析和决策。

    2023-03-16 11:34:20
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关电子书

更多
新氧云原生全栈数仓最佳实践 立即下载
离线实时一体化数仓与湖仓一体—云原生大数据平台的持续演进 立即下载
企业大数据平台下数仓架构 立即下载