DataWorks中我们这分开发和生产环境,为统一开发标准,会在表前加入schema,生产和开发的schema会不同,这个参数如何配置?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在DataWorks中,可以通过配置表的物理名称和逻辑名称来实现生产和开发环境的schema分离。
物理名称:物理名称是表在MaxCompute中的真实存储名称,它包含了schema信息。在创建表时,可以通过设置物理名称来区分不同环境下的schema。例如,在物理名称中将开发环境的schema前缀设置为"dev",将生产环境的schema前缀设置为"prod"。
逻辑名称:逻辑名称是对表的一个别名,用于在DataWorks项目中进行标识和引用。它不包含schema信息,只表示表的逻辑名称。在DataWorks中,可以使用逻辑名称来引用表,而无需关心表的物理名称。
通过这种方式,你可以在DataWorks中统一使用逻辑名称来引用表,而根据物理名称的不同,实现开发和生产环境的schema分离。
需要注意的是,这种方法需要在表的创建过程中手动设置物理名称,并确保逻辑名称与物理名称的对应关系正确。此外,还需要在DataWorks任务中正确引用表的逻辑名称。
在DataWorks中,可以通过配置表的属性来指定表所属的schema,以实现开发和生产环境的schema不同。在表的属性中,可以设置Schema属性来指定表所属的schema名称。具体配置步骤如下:
1、在DataWorks中打开所需的工作空间。
2、在工作空间中选择对应的项目,进入项目页面。
3、在项目页面中选择表管理,找到需要配置的表。
4、点击编辑表,进入表的编辑页面。
5、在编辑页面中,找到属性设置部分,点击添加属性。
6、在添加属性的对话框中,设置属性名称为Schema,属性值为对应的schema名称(开发环境或生产环境的schema名称)。
7、点击确定保存属性设置。
8、保存表的编辑内容,完成配置。
通过以上步骤,就可以为表指定不同的schema,实现开发和生产环境的schema差异化配置
需要在表名前添加schema的情况,可以通过在分区信息中配置schema来实现。
具体来说,可以按照以下步骤配置开发和生产环境的schema:
在DataWorks项目中,选择“开发环境”或“生产环境”,进入该环境的管理界面。
在该环境的“数据开发”页面中,选择“分区管理”,然后添加一个新的分区,例如“dev”。
在“分区管理”页面中,选择添加的分区“dev”,然后选择“数据表”选项卡。在该页面中,可以创建新的数据表,或者为已有的数据表添加分区信息。
在创建或修改数据表的过程中,可以在表名前添加schema信息,例如“dev.test_table”。
在生产环境中,同样可以按照以上步骤创建一个名为“prod”的分区,然后在数据表中使用“prod”作为schema信息,例如“prod.test_table”。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。