DataWorks公共维度汇总层(DIM)建表示例是什么?

DataWorks公共维度汇总层(DIM)建表示例是什么?

展开
收起
真的很搞笑 2023-07-30 16:17:09 222 分享 版权
2 条回答
写回答
取消 提交回答
  • DataWorks中的公共维度汇总层(DIM)是用于存储和管理共享的维度数据的一种组件。在DIM中,可以定义各种维度,并将其应用于多个业务表中,以实现数据的一致性和准确性。

    以下是一个示例,展示如何在DataWorks中创建一个简单的公共维度汇总层:

    1. 登录DataWorks管控台,并进入您的项目空间。
    2. 在项目空间的左侧导航栏中,选择"数据开发"。
    3. 在"数据开发"页面中,选择您想要创建公共维度汇总层的文件夹或工程。
    4. 右键点击文件夹或工程,选择"新建",然后选择"ODPS SQL脚本"。
    5. 在新建的SQL脚本中,定义您的维度表结构,例如:
      CREATE TABLE dim_date (
      date_id STRING,
      date_value DATE,
      year INT,
      month INT,
      day INT
      );
      
    6. 定义好维度表结构后,您可以插入或导入维度数据,例如:
      INSERT INTO dim_date VALUES
      ('20220101', '2022-01-01', 2022, 1, 1),
      ('20220102', '2022-01-02', 2022, 1, 2),
      ('20220103', '2022-01-03', 2022, 1, 3);
      
    7. 在其他业务表中使用该公共维度时,可以通过关联维度表的方式进行数据查询和汇总,例如:
      SELECT a.order_id, b.date_value, a.amount
      FROM fact_orders a
      JOIN dim_date b ON a.date_id = b.date_id;
      

    这只是一个简单的示例,您可以根据实际需求定义更复杂的维度结构和逻辑。

    请注意,创建和管理公共维度汇总层需要具备相应的权限和数据开发能力。确保您已经了解DataWorks的操作方法,并参考DataWorks的官方文档或帮助中心,以获取更详细的说明和指导。
    =

    2023-07-31 13:11:26
    赞同 展开评论
  • 本例中,最终的维表建表语句如下所示。CREATE TABLE IF NOT EXISTS dim_asale_itm(item_id BIGINT COMMENT '商品ID',item_title STRING COMMENT '商品名称',itemprice DOUBLE COMMENT '商品成交价格元',item_stuff_status BIGINT COMMENT '商品新旧程度_0全新1闲置2二手',cate_id BIGINT COMMENT '商品类目ID',cate_name STRING COMMENT '商品类目名称',commodity_id BIGINT COMMENT '品类ID',commodity_name STRING COMMENT '品类名称',item_status BIGINT COMMENT '商品状态_0正常1用户删除2下架3未上架',city STRING COMMENT '商品所在城市',prov STRING COMMENT '商品所在省份')COMMENT '商品全量表'PARTITIONED BY (ds STRING COMMENT '日期,yyyymmdd');CREATE TABLE IF NOT EXISTS dim_pub_area(city_code STRING COMMENT '城市code',city_name STRING COMMENT '城市名称',prov_code STRING COMMENT '省份code',prov_name STRING COMMENT '省份名称')COMMENT '公共区域维表'PARTITIONED BY (ds STRING COMMENT '日期分区,格式yyyymmdd')LIFECYCLE 3600;
    https://help.aliyun.com/document_detail/154245.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-07-30 16:31:59
    赞同 展开评论

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

还有其他疑问?
咨询AI助理