开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks如何使用 CREATE AS 创建分区表?

DataWorks如何使用 CREATE AS 创建分区表?非分区表转换成分区表

展开
收起
真的很搞笑 2023-11-20 07:53:32 360 0
4 条回答
写回答
取消 提交回答
  • 在阿里云的DataWorks中,CREATE AS 是用于创建分区表的SQL语句。以下是使用CREATE AS创建分区表的步骤:

    1. 登录DataWorks控制台:打开浏览器,访问DataWorks控制台(https://data.aliyun.com/),并使用你的账号登录。

    2. 在左侧菜单栏中,点击“数据开发”选项。

    3. 在“数据开发”页面中,找到你要创建分区表的ODPS实例,点击进入ODPS实例页面。

    4. 在ODPS实例页面中,点击“SQL编辑器”选项。

    5. 在SQL编辑器中,输入以下CREATE AS语句,然后点击“运行”按钮:

    CREATE TABLE table_name
    AS SELECT * FROM source_table
    DISTRIBUTE BY HASH(partition_key) BUCKETS n;
    

    其中,table_name是你想要创建的分区表的名称,source_table是你想要复制的数据源表,partition_key是分区表的分区字段,n是分区的数量。

    1. 等待SQL执行完成后,你就可以在ODPS实例页面中看到新创建的分区表了。

    注意:CREATE AS语句只能用于创建分区表,不能用于将非分区表转换成分区表。如果你想要将非分区表转换成分区表,你需要先删除原表,然后使用CREATE AS重新创建一张分区表。

    2023-11-29 15:43:43
    赞同 展开评论 打赏
  • 2023-11-20 21:41:50
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    DataWorks中可以使用CREATE TABLE AS语句创建分区表。这是一个特殊的CREATE TABLE语句,用于创建新的分区表并将现有表中的数据复制到新表中。下面是基本语法:

    CREATE [LOCAL] TEMPORARY | [GLOBAL] TEMPORARY | [EXTERNAL] TABLE [IF NOT EXISTS] table_name 
          ( column_name data_type [(length)] [[,] column_name data_type [(length)]]* ) 
          [COMMENT 'comment'] 
          [PARTITIONED BY (column_name data_type [(length)] [[,] column_name data_type [(length)]]*)] 
          [LIFECYCLE number [DAYS|WEEKS|MONTHS|YEARS]]
          [LOCATION 'path']
    

    关于非分区表转换成分区表,可以使用INSERT INTO ... SELECT语句将数据从非分区表移动到新的分区表。首先创建一个分区表,然后将非分区表中的数据移动到新的分区表中。例如:

    CREATE TABLE table_partition ( like non_partition_table INCLUDING PROPERTIES) 
    PARTITIONED BY (year int, month int);
    INSERT INTO table_partition PARTITION (year, month)
    SELECT *, year, month FROM non_partition_table;
    
    2023-11-20 13:23:01
    赞同 展开评论 打赏
  • 创建表

    您可使用CREATE TABLE语句创建非分区表、分区表、外部表及聚簇表,详情请参见CREATE TABLE。SQL示例如下:

    create table if not exists students
    ( id BIGINT,
      name STRING,
      age BIGINT,
      birth DATE)
    partitioned by (gender STRING);
    

    开发ODPS SQL任务https://help.aliyun.com/zh/dataworks/user-guide/create-an-odps-sql-node?spm=a2c4g.11186623.0.i186

    2023-11-20 08:48:09
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载