指出在泛在智算场景下,实时推理等业务对系统时延敏感,影响体验与收益,且随着AI技术发展,推理服务下沉为基础设施,时延稳定性决定上层应用可靠性。然而,传统观测工具难以兼顾精确性、完整性和低开销,导致生产环境时延问题难定位优化。分享了全景低侵扰系统时延观测技术的实践:构建轻量化、可部署的时延分析框架,覆盖CPU调度到网络IO的全栈追踪,为系统性降低非预期时延干扰提供观测依据。实践表明该方案在性能损耗可控前提下,显著提升运维效率,为泛在智算提供高稳定、低抖动的OS支撑。
龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。