使用sls logtail的netping功能探测网络质量

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 随着多云,多region业务部署越来越普遍,对于复杂的网络链路而言,延迟/丢包成为客户关注的一个重点。sls的logtail作为可观测性的组件,目前集成了icmping和tcping的功能,帮助业务快速发现网络侧的延迟和丢包问题,提升网络可观察性。

背景

随着多云,多region业务部署越来越普遍,对于复杂的网络链路而言,延迟/丢包成为客户关注的一个重点。

sls的logtail作为可观测性的组件,目前集成了icmping和tcping的功能,帮助业务快速发现网络侧的延迟和丢包问题,提升网络可观察性。



以下操作需要先开通 阿里云日志服务SLS


sls日志服务参考帮助文档:https://help.aliyun.com/document_detail/48869.html


操作步骤

Step1 确保logtail为较新的版本

需要确保logtal的版本 >=1.0.31 (2022年4月02日发布)

升级方法参考 https://help.aliyun.com/document_detail/28982.html#section-brd-r34-3wg

如果已经是最新的版本,可以跳过这一步

Step2 创建MetricStore

image.png


image.png


Step3 配置Netping

image.png

选择自定义数据插件

image.png



image.png


image.png


netping_config_json 样例

{

   "inputs": [

       {

           "detail": {

               "tcp": [

                   {

                       "port": 80,

                       "src": "192.168.0.103",

                       "count": 3,

                       "target": "www.baidu.com"

                   }

               ],

               "interval_seconds": 60,

               "icmp": [

                   {

                       "src": "192.168.0.103",

                       "count": 3,

                       "target": "www.baidu.com"

                   }

               ]

           },

           "type": "metric_input_netping"

       }

   ]

}

其中 src要设置为要执行ping的ip地址,只有机器组里的机器,匹配到src是自己的ip的,才会执行对应的ping指令

建议单个src的ping的数量不要超过200个

Step 4 查询Metric


使用promql查询ping的结果

image.png


相关指标说明

指标名称

说明

ping_success

单次执行icmp ping的成功数

ping_failed

单次执行icmp ping的失败数

ping_total

单次执行icmp ping的总数(count)

ping_rtt_avg_ms

单次执行icmp ping的平均响应时间,单位毫秒

ping_rtt_max_ms

单次执行icmp ping的最大响应时间,单位毫秒

ping_rtt_min_ms

单次执行icmp ping的最小响应时间,单位毫秒

ping_rtt_stddev_ms

单次执行icmp ping的标准差时间,单位毫秒

ping_rtt_total_ms

单次执行icmp ping的总响应时间,单位毫秒

tcp_success

单次执行tcp ping的成功数

tcp_failed

单次执行tcp ping的失败数

tcp_total

单次执行tcp ping的总数(count)

tcp_rtt_avg_ms

单次执行tcp ping的平均响应时间,单位毫秒

tcp_rtt_max_ms

单次执行tcp ping的最大响应时间,单位毫秒

tcp_rtt_min_ms

单次执行tcp ping的最小响应时间,单位毫秒

tcp_rtt_stddev_ms

单次执行tcp ping的标准差时间,单位毫秒

tcp_rtt_total_ms

单次执行tcp ping的总响应时间,单位毫秒

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
1月前
|
Rust 前端开发 JavaScript
Tauri 开发实践 — Tauri 日志记录功能开发
本文介绍了如何为 Tauri 应用配置日志记录。Tauri 是一个利用 Web 技术构建桌面应用的框架。文章详细说明了如何在 Rust 和 JavaScript 代码中设置和集成日志记录,并控制日志输出。通过添加 `log` crate 和 Tauri 日志插件,可以轻松实现多平台日志记录,包括控制台输出、Webview 控制台和日志文件。文章还展示了如何调整日志级别以优化输出内容。配置完成后,日志记录功能将显著提升开发体验和程序稳定性。
71 1
Tauri 开发实践 — Tauri 日志记录功能开发
|
11天前
|
运维 物联网 网络虚拟化
网络功能虚拟化(NFV):定义、原理及应用前景
网络功能虚拟化(NFV):定义、原理及应用前景
29 3
|
28天前
|
存储 监控 安全
深入解析Sysmon日志:增强网络安全与威胁应对的关键一环
在不断演进的网络安全领域中,保持对威胁的及时了解至关重要。Sysmon日志在这方面发挥了至关重要的作用,通过提供有价值的见解,使组织能够加强其安全姿态。Windows在企业环境中是主导的操作系统,因此深入了解Windows事件日志、它们的独特特性和局限性,并通过Sysmon进行增强,变得至关重要。
|
9天前
|
网络协议 Unix Linux
精选2款C#/.NET开源且功能强大的网络通信框架
精选2款C#/.NET开源且功能强大的网络通信框架
|
9天前
|
网络协议 网络安全 Apache
一个整合性、功能丰富的.NET网络通信框架
一个整合性、功能丰富的.NET网络通信框架
|
1月前
|
机器学习/深度学习 算法
神经网络的结构与功能
神经网络是一种广泛应用于机器学习和深度学习的模型,旨在模拟人类大脑的信息处理方式。它们由多层不同类型的节点或“神经元”组成,每层都有特定的功能和责任。
39 0
|
2月前
|
5G 网络安全 SDN
网络功能虚拟化(NFV)和软件定义网络(SDN):赋能5G网络灵活、智能演进的关键
网络功能虚拟化(NFV)和软件定义网络(SDN):赋能5G网络灵活、智能演进的关键
73 3
|
1月前
|
监控 Linux 测试技术
Linux系统命令与网络,磁盘和日志监控总结
Linux系统命令与网络,磁盘和日志监控总结
56 0
|
1月前
|
监控 Linux 测试技术
Linux系统命令与网络,磁盘和日志监控三
Linux系统命令与网络,磁盘和日志监控三
38 0
|
1月前
|
JSON API 开发者
深入解析Python网络编程与Web开发:urllib、requests和http模块的功能、用法及在构建现代网络应用中的关键作用
深入解析Python网络编程与Web开发:urllib、requests和http模块的功能、用法及在构建现代网络应用中的关键作用
17 0
下一篇
无影云桌面