开发者社区> 问答> 正文

hive数仓建模需要注意什么?

hive数仓建模需要注意什么?

展开
收起
芯在这 2021-12-12 12:43:11 356 0
1 条回答
写回答
取消 提交回答
  • 一 、尽量选择更细的粒度

    在保留数据时间的情况下,如果选择较粗的力度,后续再想进行查分,会非常麻烦。而选择较细的粒度,合并统计为较粗的粒度比较简单操作

    二 、尽量保留更多的纬度表信息

    如果后续新添加的需求所需要的字段没有在DWD层保留,在进行重新的建模添加会非常麻烦。

    三、以需求为主导确定度量值

    度量值是主要的统计信息,直接对应业务需求,所以要按照需求倒退事实表的度量值。

    2021-12-12 13:02:09
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hive Bucketing in Apache Spark 立即下载
spark替代HIVE实现ETL作业 立即下载
2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践 立即下载