开发者社区 问答 正文

分析型数据库如何使用DMS创建和管理表?


前文中,我们已经创建了一个分析型数据库的数据库ads_demo,本章节,我们通过DMS控制台界面在ads_demo数据库中创建一个表组和一个表。
操作步骤
步骤1:在DMS中,进入ads_demo数据库,右击左侧表组对象,选择新建表组,弹出新建表组对话框,弹出如下图所示内容,我们填写表组名为test_group,其余参数先暂时使用默认值。
步骤2:点击确定建立好表组后,我们右击表组,选择新建表。在这里,我们根据测试数据的情况,建立一张有五列和一级分区的实时表。

  • 表组名:选择前面创建的test_group。
  • 表名:表名称,这里填表名为qsdemo_load_data。
  • 是否维度表:本例要创建普通表,所以不勾选。
  • 更新方式:选择批量更新,即表数据来源是通过其他系统批量导入。(如果表的数据来源来自于直接的insert插入,那么此项选择实时更新)
  • 一级分区列:user_id。在分析型数据库中,数据根据分区列进行分布式的存储和计算。这里的原始数据是按照user_id列较均匀分布,所以指定一级分区列为user_id。
  • 分区方式:进行hash分区,分区数调整为40个(一般情况下,每个分区的数据不超过800万条为宜,当然也不绝对;分区数不能超过256个)。
  • 二级分区:本例子不指定二级分区。
  • 列名:根实际情况填写,如果是从MaxCompute等系统批量导入数据目前需要和源头数据表的字段名称一致。
  • 索引方式:分析型数据库拥有强大的自动索引功能,在创建表时通常无需关心一个列的索引情况,分析型数据库会根据实际数据的分布情况来自动进行索引。所以这里我们先不调整列的索引设置。

步骤3:点击保存,弹出实际的建表DDL供校验。创建表完毕后,右击已有的表可以进行编辑。
有关表和列的详细说明,我们会在《用户指南》相关DDl的“表操作”章节中叙述。

展开
收起
nicenelly 2017-10-31 11:18:51 1860 分享 版权
阿里云 AI 助理回答

您已经成功地通过阿里云数据管理服务(DMS)在分析型数据库(AnalyticDB,原ADS)中创建了一个表组和一个表。下面是对您操作步骤的总结以及一些额外的建议和说明:

  1. 创建表组

    • 您创建了一个名为test_group的表组,这是组织和管理相关表的一种方式,有助于逻辑上的分类和权限控制。
    • 表组默认参数通常能满足初步需求,但根据实际使用场景,后续可能需要调整如存储、计算资源等配置。
  2. 创建表

    • 表名qsdemo_load_data,用于存放测试数据,未勾选维度表选项,意味着这是一个事实表,用于存储大量的事务数据。
    • 更新方式选择“批量更新”,适合于通过ETL过程从其他系统导入数据的场景,与MaxCompute等大数据处理系统的集成尤为常见。
    • 一级分区列选择了user_id,并采用hash分区策略,分区数为40。这有助于提高查询效率,尤其是在执行涉及分区列的过滤条件时。
    • 分区设计考虑了数据分布均匀性和性能优化原则,每个分区的数据量建议不超过800万条,确保了数据管理和查询的高效性。
    • 未设置二级分区,这简化了表结构,适用于不需要更细粒度数据分布的场景。
    • 列名需与源头数据表保持一致,这对于从MaxCompute等导入数据尤为重要,以避免数据映射错误。
    • 自动索引功能是AnalyticDB的一大优势,它能自动根据数据分布情况优化查询性能,减少了手动索引管理的工作量。
  3. 后续操作与注意事项

    • 在《用户指南》的“表操作”章节中,您可以获取更多关于DDL语句、表结构修改、索引管理等方面的详细信息。
    • 定期检查表的分区数据量,如果某个分区数据量过大,可能需要重新评估分区策略或进行数据重分布。
    • 考虑到性能监控和调优,利用AnalyticDB提供的性能视图和日志功能,可以及时发现并解决性能瓶颈。
    • 如果数据源发生变化或者业务需求有调整,记得适时调整表结构和分区策略,以保证系统运行效率。

综上所述,您已成功搭建了基础的数据存储框架,接下来可以根据实际业务需求,进一步优化表设计、导入数据,并开展数据分析任务。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答