互联网-阿巴巴_个人页

互联网-阿巴巴
个人头像照片
1
2
0

个人介绍

从事互联网8年,运维工程师

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2025年08月

  • 发表了文章 2025-08-02

    感叹opds的强大

正在加载, 请稍后...
滑动查看更多
  • 回答了问题 2025-08-02

    如何利用 AI 提升数据库运维效率?

    干运维这行五年,见过不少半夜被告警电话叫醒的场景,也踩过手动调参越调越乱的坑。对于 AI 运维工具,其实要求不高,就想它能实实在在解决几个痛点。首先得能看懂 “上下文”,比如磁盘快满了,不只是报个错,最好能分析是日志没清理还是业务突增导致的,给出具体的清理路径或者扩容建议。然后是 “轻重缓急” 得拎得清,别把数据库连接数过高和某个表索引失效的告警混在一起报,得告诉我们先处理哪个,不然一堆告警堆过来还是抓瞎。​至于自动执行的边界,我觉得得看 “后果严重性”。像自动清理 7 天前的日志、重启个卡死的从库这类操作,系统确认没问题后可以自己干。但涉及删数据、主库切换这种,必须得人工确认。之前有次系统自动扩容磁盘,结果把挂载点搞错了,差点影响业务,这种时候就特别庆幸有个确认环节能踩刹车。​体验了下 DAS Agent,整体感觉还行,没有那种花里胡哨的功能。它能自动识别慢查询,还会标出来哪些是重复出现的,这点比以前我们自己写脚本筛查方便多了。不过有个小问题,它推荐的索引有时候不太接地气,比如给一个日活没多少的表建联合索引,反而增加了写入压力,还得我们手动再判断下。​另外,告警推送能不能优化下?现在是邮件、短信、控制台一起响,半夜收到一堆有点烦,要是能根据时间段调整推送方式就好了,比如工作日用企业微信,凌晨只发短信。还有就是日志分析,有时候报错信息截得不全,还得自己去服务器上翻完整日志,要是能直接定位到具体行就省事儿了。​总的来说,DAS Agent 算是个靠谱的帮手,但还没到能完全脱手的地步。运维这活儿,终究还是得人机配合着来,工具把重复劳动扛起来,我们就能腾出精力琢磨怎么把系统搞得更稳当。希望后续能多些实际场景的优化,少点理论上的完美方案吧
    踩0 评论0
  • 回答了问题 2025-08-02

    ODPS 的下一个15年,大数据将迎来春天还是寒冬?

    作为服务华为的运营工程师,使用 ODPS 两年,深刻体会其在通信设备运维场景的支撑力。华为基站设备日志日均增量超 TB 级,供应链数据跨 12 个区域节点,ODPS 的湖仓一体架构让分散数据实现统一调度,这是保障 5G 基站稳定运行的关键。​AI 爆发倒逼运维模式升级。过去设备故障分析依赖 T+1 报表,如今需实时预判潜在风险,这要求 ODPS 跳出传统计算框架。​ODPS 有引领数据革命的潜力。其在华为全球供应链协同中的表现,证明了跨域数据处理能力。但面对 AI 时代,需优先突破三点:​一是实时计算引擎迭代,当前基站异常数据检测存在 30 秒延迟,需亚秒级响应支撑智能运维决策。​二是大模型集成能力,华为业务中设备故障诊断模型训练需频繁调用 ODPS 数据,现有接口适配性不足,需打造即插即用的模型训练数据接口。​三是轻量化部署工具,二线城市运维团队技术储备有限,现有数据开发工具门槛高,需推出可视化低代码平台,降低 AI 应用落地难度。​下一个十五年,ODPS 若能在这些方面突破,定能成为科技企业 AI 化转型的核心引擎。​
    踩0 评论0
正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息