开发者社区 问答 正文

分析型数据库如何使用DMS创建和管理表?

前文中,我们已经创建了一个分析型数据库数据库,分析型数据库采用关系模型存储数据,也就是使用二维表来进行数据的组织和存储。像MySQL一样,将数据灌入分析型数据库前需要需要建立对应的数据表。而分析型数据库为了管理相关联的数据表,又引入了表组的概念。
表组是数据库的下一级实体,也是表的上一级。在分析型数据库中一个表必须从属于一个表组。关于表组的具体介绍我们会在3.2节中进行。在这里,我们首先创建一个表组。
在DMS for 分析型数据库中,右击左侧表组对象,选择新建表组,弹出新建表组对话框,弹出如下图所示内容,我们填写表组名为test_group,其余参数先暂时使用默认值。

点击确定建立好表组后,我们右击表组,选择新建表。在这里,我们根据测试数据的情况,建立一张有五列和一级分区的数据表。如下图所示:

在分析型数据库中,数据根据分区列进行分布式的存储和计算。举例来讲,我们在这里的原始数据是按照user_id较均匀的进行分布的,所以我们指定按照user_id进行hash分区,分区数调整为40个(一般来讲,每个分区的数据不超过800万条为宜,当然也不绝对,分区数不能超过256个)。表名和列名根实际情况填写,目前需要和源头数据表的字段名称一致。
另外,如果这个表的数据来源是批量的从其他系统导入(例如从ODPS),那么在更新方式一项,则选择批量更新,随后阅读1.4节中的导入数据部分。如果这个表的数据来源来自于直接的insert插入,那么在更新方式一项选择实时更新,随后阅读1.4节中的插入数据一项。
分析型数据库拥有强大的自动索引功能,用户在创建表时通常无需关心一个列的索引情况,分析型数据库会根据实际数据的分布情况来自动进行索引。所以这里我们先不调整列的索引设置。而表名任意填写,表组名选择我们刚刚创建的test_group,然后点击保存,弹出实际的建表DDL供校验。
有关表和列的详细说明,我们会在3.3和3.4节中稍后叙述。创建表完毕后,右击已有的表可以进行编辑。

展开
收起
nicenelly 2017-10-26 15:01:23 2185 分享 版权
阿里云 AI 助理回答

创建表组及数据表的步骤与说明

创建表组

  1. 操作路径:在DMS(Data Management Service)界面中,针对您的分析型数据库实例,找到左侧的“表组”对象。
  2. 新建表组:右击“表组”,选择“新建表组”选项,系统将弹出创建表组的对话框。
  3. 填写信息:在对话框中,输入表组名称为test_group,其他参数保持默认值。
  4. 确认创建:点击“确定”按钮完成表组的创建。

创建数据表

  1. 选择表组:表组创建成功后,右击刚创建的test_group表组,选择“新建表”。
  2. 定义表结构

    • 表名与列定义:根据实际需求定义表名和列名,确保与源头数据表字段名称一致。例如,包括user_id作为分区键等。
    • 分区策略:由于原始数据按user_id均匀分布,选择hash分区策略,并设置分区数为40个。注意每个分区的数据量建议不超过800万条,且总分区数不超过256个。
    • 更新方式:依据数据来源决定更新方式。如果数据通过批量导入(如从ODPS),选择“批量更新”;如果是直接插入,则选择“实时更新”。
    • 索引配置:利用分析型数据库的自动索引功能,无需手动配置列索引。
  3. 保存并校验:完成表定义后,点击“保存”。系统会展示实际的建表DDL(Data Definition Language)语句供您校验,确认无误后即可完成表的创建。

注意事项

  • 确保分区数量合理,避免单个分区数据过多影响查询效率或因超过最大分区限制导致创建失败。
  • 表组是管理相关联表的关键,确保关联表位于同一表组以优化JOIN性能。
  • 利用自动索引特性,但需关注特殊场景下可能需要的手动索引调整。

以上步骤指导您在DMS for 分析型数据库中创建表组及数据表的过程,遵循最佳实践以优化数据组织和查询性能。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答