开发者社区> 问答> 正文

分析型数据库如何使用DMS创建和管理表?


前文中,我们已经创建了一个分析型数据库数据库,分析型数据库采用关系模型存储数据,也就是使用二维表来进行数据的组织和存储。像MySQL一样,将数据灌入分析型数据库前需要需要建立对应的数据表。而分析型数据库为了管理相关联的数据表,又引入了表组的概念。
表组是数据库的下一级实体,也是表的上一级。在分析型数据库中一个表必须从属于一个表组。关于表组的具体介绍我们会在3.2节中进行。在这里,我们首先创建一个表组。
在DMS for分析型数据库中,右击左侧表组对象,选择新建表组,弹出新建表组对话框,弹出如下图所示内容,我们填写表组名为test_group,其余参数先暂时使用默认值。

点击确定建立好表组后,我们右击表组,选择新建表。在这里,我们根据测试数据的情况,建立一张有五列和一级分区的数据表。如下图所示:

在分析型数据库中,数据根据分区列进行分布式的存储和计算。举例来讲,我们在这里的原始数据是按照user_id较均匀的进行分布的,所以我们指定按照user_id进行hash分区,分区数调整为40个(一般来讲,每个分区的数据不超过800万条为宜,当然也不绝对,分区数不能超过256个)。表名和列名根实际情况填写,目前需要和源头数据表的字段名称一致。
另外,如果这个表的数据来源是批量的从其他系统导入(例如从ODPS),那么在更新方式一项,则选择批量更新,随后阅读1.4节中的导入数据部分。如果这个表的数据来源来自于直接的insert插入,那么在更新方式一项选择实时更新,随后阅读1.4节中的插入数据一项。
分析型数据库拥有强大的自动索引功能,用户在创建表时通常无需关心一个列的索引情况,分析型数据库会根据实际数据的分布情况来自动进行索引。所以这里我们先不调整列的索引设置。而表名任意填写,表组名选择我们刚刚创建的test_group,然后点击保存,弹出实际的建表DDL供校验。
有关表和列的详细说明,我们会在3.3和3.4节中稍后叙述。创建表完毕后,右击已有的表可以进行编辑。

展开
收起
nicenelly 2017-10-31 11:25:08 2026 0
1 条回答
写回答
取消 提交回答
问答排行榜
最热
最新

相关电子书

更多
金融行业高频交易数据管理解决方案 立即下载
基于Spark的统一数据管理与数据探索平台 立即下载
INFINIDATA:基于Spark的统一数据管理与探索平台 立即下载