向分区表导入数据可以使用以下几种SQL语句:
INSERT INTO PARTITION:向带分区的外表中追加数据,不会覆盖原有数据,适用于静态或动态分区。例如:
INSERT INTO hdfs_import_external_par PARTITION(p1='2021-05-06', p2=1, p3='test')
SELECT col1, col2, col3 FROM adb_hdfs_import_source;
REPLACE INTO PARTITION:与INSERT INTO PARTITION类似,也是增量写入,不会覆盖已有数据。例如:
REPLACE INTO hdfs_import_external_par PARTITION(p1='2021-05-06', p2=1, p3='test')
SELECT col1, col2, col3 FROM adb_hdfs_import_source;
INSERT OVERWRITE PARTITION:覆盖写入指定分区的数据,会删除指定分区下的旧数据文件并写入新数据。例如:
INSERT OVERWRITE hdfs_import_external_par PARTITION(p1='2021-05-06', p2=1, p3='test')
SELECT col1, col2, col3 FROM adb_hdfs_import_source;
这些语句允许静态分区(明确指定每个分区的值)、半静态半动态分区(部分分区列指定值,其余动态生成)以及全动态分区(分区值完全由查询结果决定)。具体使用哪种方式取决于你的业务需求和数据处理逻辑。
此回答整理自钉群“云数据仓库ADB-开发者群”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
阿里云自主研发的云原生数据仓库,具有高并发读写、低峰谷读写、弹性扩展、安全可靠等特性,可支持PB级别数据存储,可广泛应用于BI、机器学习、实时分析、数据挖掘等场景。包含AnalyticDB MySQL版、AnalyticDB PostgreSQL 版。