DataWorks如何使用 CREATE AS 创建分区表?非分区表转换成分区表
在阿里云的DataWorks中,CREATE AS 是用于创建分区表的SQL语句。以下是使用CREATE AS创建分区表的步骤:
登录DataWorks控制台:打开浏览器,访问DataWorks控制台(https://data.aliyun.com/),并使用你的账号登录。
在左侧菜单栏中,点击“数据开发”选项。
在“数据开发”页面中,找到你要创建分区表的ODPS实例,点击进入ODPS实例页面。
在ODPS实例页面中,点击“SQL编辑器”选项。
在SQL编辑器中,输入以下CREATE AS语句,然后点击“运行”按钮:
CREATE TABLE table_name
AS SELECT * FROM source_table
DISTRIBUTE BY HASH(partition_key) BUCKETS n;
其中,table_name
是你想要创建的分区表的名称,source_table
是你想要复制的数据源表,partition_key
是分区表的分区字段,n
是分区的数量。
注意:CREATE AS语句只能用于创建分区表,不能用于将非分区表转换成分区表。如果你想要将非分区表转换成分区表,你需要先删除原表,然后使用CREATE AS重新创建一张分区表。
感觉不支持 可以联系maxcompute同学核实一下https://help.aliyun.com/zh/maxcompute/user-guide/table-operations-1?spm=a2c4g.11186623.0.i8![image.png](https://ucc.alicdn.com/pic/developer-ecology/wyvq5mjsckydw_76480639c4404685a4b3f2ae378b9f0c.png)
,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
DataWorks中可以使用CREATE TABLE AS语句创建分区表。这是一个特殊的CREATE TABLE语句,用于创建新的分区表并将现有表中的数据复制到新表中。下面是基本语法:
CREATE [LOCAL] TEMPORARY | [GLOBAL] TEMPORARY | [EXTERNAL] TABLE [IF NOT EXISTS] table_name
( column_name data_type [(length)] [[,] column_name data_type [(length)]]* )
[COMMENT 'comment']
[PARTITIONED BY (column_name data_type [(length)] [[,] column_name data_type [(length)]]*)]
[LIFECYCLE number [DAYS|WEEKS|MONTHS|YEARS]]
[LOCATION 'path']
关于非分区表转换成分区表,可以使用INSERT INTO ... SELECT语句将数据从非分区表移动到新的分区表。首先创建一个分区表,然后将非分区表中的数据移动到新的分区表中。例如:
CREATE TABLE table_partition ( like non_partition_table INCLUDING PROPERTIES)
PARTITIONED BY (year int, month int);
INSERT INTO table_partition PARTITION (year, month)
SELECT *, year, month FROM non_partition_table;
创建表
您可使用CREATE TABLE语句创建非分区表、分区表、外部表及聚簇表,详情请参见CREATE TABLE。SQL示例如下:
create table if not exists students
( id BIGINT,
name STRING,
age BIGINT,
birth DATE)
partitioned by (gender STRING);
开发ODPS SQL任务https://help.aliyun.com/zh/dataworks/user-guide/create-an-odps-sql-node?spm=a2c4g.11186623.0.i186
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。