【故障定位系列】波动度故障
本文探讨SQL耗时故障的自适应定位方法,针对不同波动程度的故障,提出通过自学习正常区间特征(如方差、标准差)实现异常检测,并结合上下游响应时间比例关系判断根因,辅以实战案例验证定位准确性。
可观测领域的王者Dynatrace的故障定位体验
本文对比了可观测性领域两大工具Databuff与Dynatrace的故障定位能力。基于17服务的微服务环境测试显示,Databuff在10个案例中准确率达90%,定位更精准、信息更全面;Dynatrace准确率60%,部分场景存在误判或信息缺失,整体表现逊色。
《AI大模型时代老板必修课》
阿里云CIO蒋林泉与钛媒体刘湘明在云栖大会畅谈AI落地实践,分享企业AI推进的“五段论”、CIO角色进化、场景选择与战略制定。强调AI需扎根语言类、重复性高、有业务压力的场景,提出“樱桃蛋糕”模型:AI是樱桃,成熟系统是蛋糕坯。呼吁CIO躬身入局,通过认证拉齐认知,以行动破除焦虑,推动AI真正落地。