容器服务Kubernetes版

首页 标签 容器服务Kubernetes版
|
5天前
|
【架构实战】Kubernetes日志收集:EFK/Loki架构
Kubernetes日志是排查问题的关键: 日志类型: 容器日志(stdout/stderr) 宿主机日志 应用日志 K8s组件日志
云上 K8s GPU 节点 ImagePullBackOff 排查记录
本文记录云上K8s(v1.36)GPU节点模型评测Job因`ImagePullBackOff`卡在Pending的排查过程,聚焦containerd镜像拉取失败根因,涵盖crictl验证、日志分析、DNS/镜像源配置检查,并强调分层排障:先运行时,再资源调度与设备挂载。
|
9天前
|
K8s Ingress 502 排查:先看 Service、Endpoints 和 readinessProbe
本文详解K8s中Ingress返回502的系统化排查思路:不盲目修改Ingress,而是按Pod→Service→Endpoints→readinessProbe→Ingress逐层验证。重点检查Pod就绪状态、Service selector与targetPort匹配性、Endpoints是否为空、健康探针配置合理性等核心环节,直击502根本原因——上游服务未就绪。(239字)
|
10天前
| |
来自: 数据库
k8s 安装posgresql
本指南介绍如何在K8s集群中快速部署PostgreSQL官方镜像(v18.3),配合local-path-provisioner提供本地持久化存储。含命名空间、PVC、Deployment与Service完整YAML,支持国产镜像加速,兼顾14–18版本路径兼容性,适用于开发与测试环境。(239字)
|
10天前
| |
来自: 云原生
Jellyfin 上 K8s 前,先把镜像、PVC 和权限排一遍
本文记录Jellyfin从Docker Compose迁移至K8s测试环境的典型问题排查:镜像拉取慢、PVC未绑定致媒体目录为空、容器用户权限不足、路径配置错误等。强调K8s中“宿主机→PV→PVC→volumeMount→容器路径”的分层模型,须逐层验证,避免误判。
|
11天前
|
我把服务器密码给了 OpenClaw,10 分钟后一个 K8s 集群跑起来了
我把两台临时ECS交给OpenClaw,让它从零搭建K8s集群、排查公网访问问题并完成验收。10 分钟后,我真切感到AI Agent正在从回答问题走向完成任务。
|
11天前
|
AI Agent 工具链上 K8s 前的镜像和运行时预检
本文记录AI Agent工具链(MCP Server、浏览器自动化、代码runner等)迁移至K8s测试环境的预检实践,聚焦镜像拉取失败(ImagePullBackOff)、权限控制、最小化部署与可观测性,强调“本地能跑≠K8s可用”,突出工程化预检三原则:镜像可达、容器可启、边界可控。(239字)
|
13天前
|
AI 推理服务上 K8s 前,我先查了 GPU、Probe 和回滚
本文介绍vLLM推理服务上K8s前的关键预检:验证镜像拉取、GPU节点调度、探针配置(尤其startupProbe防误杀)、日志可观测性及回滚路径,聚焦AI服务冷启动特性,分层排查保障部署稳健性。(239字)
免费试用