在日常数据库运维中,AI 工具最期待具备以下三类能力:
异常识别能力强:能主动发现慢 SQL、连接暴涨、资源异常等问题,并提供清晰可解释的预警信息,减少人工排查时间。
根因定位精准:通过历史数据和上下文建模,快速缩小问题范围,例如定位是业务侧变更引起,还是系统层资源瓶颈。
优化建议可执行:不仅能给出优化建议,如索引优化、SQL改写,还能结合实际环境评估其收益和风险。
对于 AI 自动执行的边界,我认为要“放权不失控”。如自动清理临时表、扩容提示等可以自动执行,但涉及DDL变更、读写流量切换、跨实例迁移等高风险操作,必须有人工确认环节。
我体验了 DAS Agent 后,最大的感受是将专家经验转化为标准化能力,尤其是对慢 SQL 的分析,比传统 AWR 工具更易用,也更聚焦核心问题。建议后续可以增加业务波动分析和版本回退建议功能,辅助用户从“治标”走向“治本”。
DAS Agent 确实让我看到了 AI 运维从辅助走向自治的可能,期待未来能在生产环境中真正做到“7x24 无人值守+智能调优”。