使用sls logtail的netping功能探测网络质量

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 随着多云,多region业务部署越来越普遍,对于复杂的网络链路而言,延迟/丢包成为客户关注的一个重点。sls的logtail作为可观测性的组件,目前集成了icmping和tcping的功能,帮助业务快速发现网络侧的延迟和丢包问题,提升网络可观察性。

背景

随着多云,多region业务部署越来越普遍,对于复杂的网络链路而言,延迟/丢包成为客户关注的一个重点。

sls的logtail作为可观测性的组件,目前集成了icmping和tcping的功能,帮助业务快速发现网络侧的延迟和丢包问题,提升网络可观察性。



以下操作需要先开通 阿里云日志服务SLS


sls日志服务参考帮助文档:https://help.aliyun.com/document_detail/48869.html


操作步骤

Step1 确保logtail为较新的版本

需要确保logtal的版本 >=1.0.31 (2022年4月02日发布)

升级方法参考 https://help.aliyun.com/document_detail/28982.html#section-brd-r34-3wg

如果已经是最新的版本,可以跳过这一步

Step2 创建MetricStore

image.png


image.png


Step3 配置Netping

image.png

选择自定义数据插件

image.png



image.png


image.png


netping_config_json 样例

{

   "inputs": [

       {

           "detail": {

               "tcp": [

                   {

                       "port": 80,

                       "src": "192.168.0.103",

                       "count": 3,

                       "target": "www.baidu.com"

                   }

               ],

               "interval_seconds": 60,

               "icmp": [

                   {

                       "src": "192.168.0.103",

                       "count": 3,

                       "target": "www.baidu.com"

                   }

               ]

           },

           "type": "metric_input_netping"

       }

   ]

}

其中 src要设置为要执行ping的ip地址,只有机器组里的机器,匹配到src是自己的ip的,才会执行对应的ping指令

建议单个src的ping的数量不要超过200个

Step 4 查询Metric


使用promql查询ping的结果

image.png


相关指标说明

指标名称

说明

ping_success

单次执行icmp ping的成功数

ping_failed

单次执行icmp ping的失败数

ping_total

单次执行icmp ping的总数(count)

ping_rtt_avg_ms

单次执行icmp ping的平均响应时间,单位毫秒

ping_rtt_max_ms

单次执行icmp ping的最大响应时间,单位毫秒

ping_rtt_min_ms

单次执行icmp ping的最小响应时间,单位毫秒

ping_rtt_stddev_ms

单次执行icmp ping的标准差时间,单位毫秒

ping_rtt_total_ms

单次执行icmp ping的总响应时间,单位毫秒

tcp_success

单次执行tcp ping的成功数

tcp_failed

单次执行tcp ping的失败数

tcp_total

单次执行tcp ping的总数(count)

tcp_rtt_avg_ms

单次执行tcp ping的平均响应时间,单位毫秒

tcp_rtt_max_ms

单次执行tcp ping的最大响应时间,单位毫秒

tcp_rtt_min_ms

单次执行tcp ping的最小响应时间,单位毫秒

tcp_rtt_stddev_ms

单次执行tcp ping的标准差时间,单位毫秒

tcp_rtt_total_ms

单次执行tcp ping的总响应时间,单位毫秒

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
1天前
|
存储 监控 安全
网络安全视角:从地域到账号的阿里云日志审计实践
日志审计的必要性在于其能够帮助企业和组织落实法律要求,打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用,一方面是选择国家网络安全专用认证的日志分析产品,另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外,还可通过报表分析和告警配置,主动发现潜在的安全威胁,增强云上资产安全。
|
3天前
|
监控 安全 Linux
启用Linux防火墙日志记录和分析功能
为iptables启用日志记录对于监控进出流量至关重要
|
22天前
|
监控 测试技术 开发者
一行代码改进:Logtail的多行日志采集性能提升7倍的奥秘
一个有趣的现象引起了作者的注意:当启用行首正则表达式处理多行日志时,采集性能出现下降。究竟是什么因素导致了这种现象?本文将探索Logtail多行日志采集性能提升的秘密。
|
1月前
|
机器学习/深度学习 运维 安全
图神经网络在欺诈检测与蛋白质功能预测中的应用概述
金融交易网络与蛋白质结构的共同特点是它们无法通过简单的欧几里得空间模型来准确描述,而是需要复杂的图结构来捕捉实体间的交互模式。传统深度学习方法在处理这类数据时效果不佳,图神经网络(GNNs)因此成为解决此类问题的关键技术。GNNs通过消息传递机制,能有效提取图结构中的深层特征,适用于欺诈检测和蛋白质功能预测等复杂网络建模任务。
71 2
图神经网络在欺诈检测与蛋白质功能预测中的应用概述
|
1月前
|
安全 网络安全 数据安全/隐私保护
利用Docker的网络安全功能来保护容器化应用
通过综合运用这些 Docker 网络安全功能和策略,可以有效地保护容器化应用,降低安全风险,确保应用在安全的环境中运行。同时,随着安全威胁的不断变化,还需要持续关注和研究新的网络安全技术和方法,不断完善和强化网络安全保护措施,以适应日益复杂的安全挑战。
44 5
|
1月前
|
存储 监控 数据挖掘
计算机网络的功能
计算机网络支持信息交换、资源共享、分布式处理、可靠性增强及集中管理。信息交换涵盖多种媒体形式,促进远程协作;资源共享降低用户成本,提高效率;分布式处理提升计算能力;冗余机制保障系统稳定;集中管理简化网络维护,确保安全运行。
36 2
|
1月前
|
运维 物联网 网络虚拟化
网络功能虚拟化(NFV):定义、原理及应用前景
网络功能虚拟化(NFV):定义、原理及应用前景
88 3
|
1月前
|
网络协议 Unix Linux
精选2款C#/.NET开源且功能强大的网络通信框架
精选2款C#/.NET开源且功能强大的网络通信框架