云数据仓库ADBINSERT OVERWRITE 操作的IO使用率太高了,有啥别的方案吗?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在云数据仓库AnalyticDB(ADB)中,INSERT OVERWRITE
操作的IO使用率过高可能会影响整体性能。根据知识库中的参考资料,以下是优化和替代方案的具体建议:
INSERT OVERWRITE
操作adb.load.job.max.acu
参数增大单个弹性任务使用的资源,提升并发度和导入速度。实例规格最大IO带宽(Gbit/s) × 1024 × 1024 ÷ 8 ÷ 16
升级后可以缓解高IO负载问题。
INSERT OVERWRITE
操作。建议将此类任务安排在业务低峰期执行,以减少对在线业务的影响。set adb_config O_CBO_MAINTENANCE_WINDOW_DURATION = [04:00-05:00];
set adb_config O_CBO_AUTONOMOUS_STATS_ACCOUNT = [user_name];
set adb_config O_CBO_AUTONOMOUS_STATS_ENABLED=false;
INSERT OVERWRITE
操作会触发Build任务,包括构建索引、建立和清除分区等操作。这些任务可能导致存储节点的CPU和IO使用率增高。建议对比CPU使用率和Build任务数的监控数据,定位问题并优化。针对 INSERT OVERWRITE
操作的高IO使用率问题,可以从优化写入方式、升级实例配置、调整运维时间、监控诊断以及使用替代方案等多个角度进行优化。具体选择哪种方案,需结合实际业务场景和资源使用情况进行权衡。
阿里云自主研发的云原生数据仓库,具有高并发读写、低峰谷读写、弹性扩展、安全可靠等特性,可支持PB级别数据存储,可广泛应用于BI、机器学习、实时分析、数据挖掘等场景。包含AnalyticDB MySQL版、AnalyticDB PostgreSQL 版。