请问这个问题怎么定位?发生的很频繁,1.3 1.4 均出现。

OpenKruise 中error: clonesets.apps.kruise.io ""example"" could not be patched: Internal error occurred: failed calling webhook ""vcloneset.kb.io"": failed to call webhook: Post ""https://kruise-webhook-service.kruise-system.svc:443/validate-apps-kruise-io-v1alpha1-cloneset?timeout=30s"": net/http: request canceled (Client.Timeout exceeded while awaiting headers)

请问这个问题怎么定位?发生的很频繁,1.3 1.4 均出现。
kruise-controller-manager-6dd6b85c88-vp5z5 1/1 Running 0 44m
kruise-controller-manager-6dd6b85c88-zg8nq 1/1 Running 0 44m
我刚部署在测试,从 1.4 换到 1.3。

展开
收起
十一0204 2023-07-19 21:28:50 244 分享 版权
2 条回答
写回答
取消 提交回答
  • 该错误提示表明在进行克隆集(Cloneset)的修补操作时出现问题。具体定位此问题可能需要进一步的调查和排查,以下是一些常见的定位步骤:

    1. 检查 Webhook 服务状态:确保 kruise-webhook-service 服务正常运行,并且没有任何相关的报错或异常。可以使用以下命令查看相关服务的状态:

      kubectl get svc -n kruise-system
      
    2. 检查网络连接问题:检查集群中的网络连接是否正常、稳定。您可以通过访问 https://kruise-webhook-service.kruise-system.svc:443 来测试与 Webhook 服务的通信情况。

    3. 检查 OpenKruise 控制器管理器状态:确保 kruise-controller-manager Pod 正常运行,并无异常日志或报错信息。您可以通过以下命令来查看 Pod 的状态和日志:

      kubectl get pods -n kruise-system
      kubectl logs <controller_manager_pod_name> -n kruise-system
      
    4. 调整超时时间:根据报错信息,超时时间似乎被耗尽导致请求被取消。您可以尝试增加请求的超时时间来解决这个问题。具体的配置位置取决于您的环境和部署方式,请查阅 OpenKruise 的官方文档和配置说明。

    如果上述步骤仍然无法解决问题,请考虑向 OpenKruise 的官方渠道(例如 GitHub 仓库或社区论坛)寻求帮助。提供更多的详细信息(如日志、配置文件等)可以帮助开发人员更好地理解和排查问题。同时,确保您使用的是最新版本的 OpenKruise,并关注任何已知的问题、错误修复或更新版本。

    2023-07-28 11:37:46
    赞同 展开评论
  • 意中人就是我呀!

    这是 kruise-manager 在读取 k8s apiserver 发过来的 http request body,这个失败的话,只能是网络问题了。934781324849eced420ffbc92d09520b.png
    没有其他的流程了,这个逻辑只能是 apiserver 请求 kruise-manager webhook 了。
    这是clusterIP 是虚拟的。真正访问的时候 会经过kube-proxy 的转换的。
    因为这个过程不会有别的调用了,你可以看看 社区的 K8S webhook 机制。此回答整理至钉群“OpenKruise 社区交流群”。

    2023-07-20 08:05:04
    赞同 展开评论
问答分类:
问答地址:

阿里云拥有国内全面的云原生产品技术以及大规模的云原生应用实践,通过全面容器化、核心技术互联网化、应用 Serverless 化三大范式,助力制造业企业高效上云,实现系统稳定、应用敏捷智能。拥抱云原生,让创新无处不在。

还有其他疑问?
咨询AI助理