在应用实时监控ARMS中请问如果我想只对请求比较耗时,或者有错误的 trace 进行采样,还有其他的方案吗?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在应用实时监控服务(ARMS)中,如果您希望只对请求比较耗时或者有错误的 Trace 进行采样,除了默认的采样策略外,还可以通过以下方案实现:
ARMS 提供了专门针对错误和慢调用的采样策略,称为错慢异常采样。该策略会根据接口的错误状态或耗时情况自动触发采样。
命中错慢异常采样的 Span 会携带以下 Attribute: - sample.reason=s9
:接口报错。 - sample.reason=s11
:接口内部执行抛出异常。 - sample.reason=s10
:接口调用耗时高。
如果同时开启了分位数统计功能,当接口调用耗时大于 P99 分位数时,也会被识别为慢调用并触发采样。
如果上述策略无法完全满足需求,您可以通过自定义采样来指定需要 100% 采样的接口、接口前缀或后缀。
命中自定义采样的 Span 会携带以下 Attribute: - sample.reason=s3
:自定义采样。
ARMS 提供了强大的 错/慢 Trace 分析 功能,可以帮助您快速定位问题根因,并结合采样策略优化数据采集。
自适应采样模式通过动态调整采样策略,能够更好地覆盖错慢调用场景。
通过以上方案,您可以灵活配置 ARMS 的采样策略,确保重点关注的错慢调用 Trace 被有效采集和分析。
云原生可观测基于Prometheus、Grafana 、OpenTelemetry 等核心产品, 形成指标、链路存储分析、异构数据源集成的数据层, 通过标准PromQL和SQL提供大盘展示、告警与探索能力。