Linkerd 2.10—使用 Debug Sidecar,注入调试容器来捕获网络数据包

本文涉及的产品
容器服务 Serverless 版 ACK Serverless,952元额度 多规格
容器服务 Serverless 版 ACK Serverless,317元额度 多规格
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: Linkerd 2.10—使用 Debug Sidecar,注入调试容器来捕获网络数据包

调试服务网格(service mesh)可能很困难。当某些东西不起作用时, 是代理(proxy)有问题吗?与应用程序(application)?与客户端(client)?与底层网络?(underlying network)有时, 没有什么比查看原始网络数据更好的了。


如果您需要对进入(entering)和离开(leaving)应用程序的数据包进行 网络级可见性(network-level visibility), Linkerd 提供了带有一些有用工具的 debug sidecar。与 proxy sidecar injection 的工作方式类似, 您可以通过在 pod 创建时设置 config.linkerd.io/enable-debug-sidecar: "true" annotation 来向 pod 添加 debug sidecar。为方便起见,linkerd inject 命令提供了 一个 --enable-debug-sidecar 选项来为你做这个注解。


(请注意,Kubernetes pod 中的容器集不是可变的,因此简单地将此 annotation 添加到预先存在的 pod 中是行不通的。它必须在创建 pod 时存在。)

debug sidecar 镜像包含 tsharktcpdumplsofiproute2。安装后,它会开始使用 tshark 自动记录所有传入和传出的流量, 然后可以使用 kubectl logs 查看这些流量。或者,您可以使用 kubectl exec 访问容器并直接运行命令。


例如,如果您已经阅读了 Linkerd 入门指南 并安装了 emojivoto 应用程序,并希望调试 voting 服务的流量,您可以运行:


kubectl -n emojivoto get deploy/voting -o yaml \
  | linkerd inject --enable-debug-sidecar - \
  | kubectl apply -f -


debug sidecar 容器部署到 voting 服务中的所有 pod。(请注意,此部署中只有一个 Pod,它将被重新创建以执行此 操作 - 请参阅上面有关 Pod 可变性的说明。)

您可以通过列出带有 voting-svc 标签的 pod 中的所有容器来确认调试容器正在运行:


kubectl get pods -n emojivoto -l app=voting-svc \
  -o jsonpath='{.items[*].spec.containers[*].name}'


然后,您可以通过简单地运行来查看日志中的实时 tshark 输出:


kubectl -n emojivoto logs deploy/voting linkerd-debug -f


如果这还不够,您可以 exec 到容器并在网络上下文中运行您自己的命令。例如,如果您想检查请求的 HTTP headers,您可以运行如下代码:


kubectl -n emojivoto exec -it \
  $(kubectl -n emojivoto get pod -l app=voting-svc \
    -o jsonpath='{.items[0].metadata.name}') \
  -c linkerd-debug -- tshark -i any -f "tcp" -V -Y "http.request"


由代理编写的 debug sidecar 在故障排除中 有效的实际错误消息是 Connection Refused 错误,如下所示:


ERR! [<time>] proxy={server=in listen=0.0.0.0:4143 remote=some.svc:50416}
linkerd2_proxy::app::errors unexpected error: error trying to connect:
Connection refused (os error 111) (address: 127.0.0.1:8080)


在这种情况下,可以修改 tshark 命令以侦听错误中提到的特定端口之间的流量,如下所示:


kubectl -n emojivoto exec -it \
 $(kubectl -n emojivoto get pod -l app=voting-svc \
  -o jsonpath='{.items[0].metadata.name}') \
  -c linkerd-debug -- tshark -i any -f "tcp" -V \
  -Y "(tcp.srcport == 4143 and tcp.dstport == 50416) or tcp.port == 8080"


请注意,消息 Connection reset by peer 也有类似的错误。如果您在应用程序日志输出中没有看到相关的错误或消息,则此错误通常是良性的。在这种情况下,调试容器可能无法帮助解决错误消息。


ERR! [<time>] proxy={server=in listen=0.0.0.0:4143 remote=some.svc:35314}
linkerd2_proxy::app::errors unexpected error: connection error:
Connection reset by peer (os error 104)


当然,这些示例仅在您能够 exec 到 Kubernetes 集群中的任意容器时才有效。有关此方法的替代方法,请参阅 linkerd tap


相关文章
|
1月前
状态码对于理解HTTP请求和响应的流程,以及调试网络问题非常重要
【5月更文挑战第15天】HTTP状态码由三位数字表示,分为1xx-5xx五类。1xx为信息响应,2xx表示成功,如200(请求成功)、201(创建成功)。3xx是重定向,如301(永久移动)、302(临时重定向)。4xx表示客户端错误,如400(坏请求)、404(未找到)。5xx是服务器错误,包括500(内部服务器错误)和503(服务不可用)。这些状态码用于理解请求响应流程和调试网络问题。
30 1
|
2天前
|
小程序 Java 关系型数据库
基于SpringBoot+Vue大学生网络教学平台设计和实现(源码+LW+调试文档+讲解等)
基于SpringBoot+Vue大学生网络教学平台设计和实现(源码+LW+调试文档+讲解等)
|
2天前
|
小程序 Java 关系型数据库
基于Java网络商城系统设计和实现(源码+LW+调试文档+讲解等)
基于Java网络商城系统设计和实现(源码+LW+调试文档+讲解等)
|
25天前
|
缓存 网络协议 Linux
玩转网络调试利器:深入剖析ip命令的强大功能
玩转网络调试利器:深入剖析ip命令的强大功能
25 2
|
1月前
|
存储 Prometheus 监控
【Docker 专栏】Docker 容器内应用的调试与故障排除
【5月更文挑战第8天】本文探讨了Docker容器内应用的调试与故障排除,强调其重要性。方法包括:通过日志排查、进入容器检查、使用监控工具及检查容器配置。常见问题涉及应用启动失败、性能问题、网络连接和数据存储。案例分析展示了实战场景,注意事项提醒避免不必要的容器修改、备份数据和理解应用架构。掌握这些技能能确保Docker应用的稳定运行和性能优化。
【Docker 专栏】Docker 容器内应用的调试与故障排除
|
8天前
|
Kubernetes NoSQL Redis
将 Sidecar 容器带入新的阶段
将 Sidecar 容器带入新的阶段
|
12天前
|
Web App开发 JSON 前端开发
网络调试利器:Chrome Network工具的详细指南
Chrome开发者工具的Network面板是测试工程师的利器,用于监视HTTP请求、响应及资源加载。打开它可通过右键点击页面选择“检查”或使用快捷键。界面包含请求列表和详细信息,如Headers、Preview、Response、Timing。过滤器帮助定位特定请求,而瀑布流图展示加载顺序。模拟网络环境和保存HAR文件功能便于性能分析和问题排查。
20 0
|
1月前
|
弹性计算 安全 微服务
【阿里云云原生专栏】容器网络技术前沿:阿里云Terway网络方案详解
【5月更文挑战第26天】阿里云Terway是高性能的容器网络方案,基于ECS的ENI实现,提供低延迟高吞吐的网络服务。它简化网络管理,实现安全隔离,并与阿里云服务无缝集成。Terway由CNI、Node和Controller组成,适用于微服务、混合云和多租户环境,为企业数字化转型中的复杂网络需求提供强大支持。
238 1
|
1月前
|
缓存 网络安全 Android开发
|
22天前
|
安全 数据安全/隐私保护 Docker
Docker 容器连接:构建安全高效的容器化网络生态
Docker 容器连接:构建安全高效的容器化网络生态