ZStack dGPU:让虚拟机里的 GPU 也能按需切分
ZStack dGPU 是面向虚拟机的纯软件GPU动态切分方案,无需NVIDIA vGPU授权或MIG硬件限制,支持主流NVIDIA GPU。实现显存与算力按需分配、即时回收,推理性能损耗仅约7%,23.5小时零故障运行。补齐IaaS层GPU细粒度调度能力,提升私有云GPU利用率。(239字)
containerd 节点 GPU 镜像预热记录
本次在GPU节点复现推理环境时,首遇镜像拉取失败(ImagePullBackOff),Pod卡在ContainerCreating状态。通过`crictl pull`逐源验证并预热vLLM、CUDA、Prometheus及pause镜像,明确分离镜像问题与模型问题,提升排障效率。(239字)
智能驾驶感知环境容器镜像预检记录
本文介绍智能驾驶感知环境部署前的镜像预检实践:针对CUDA、ROS2、PyTorch、Prometheus、K8s等多源异构镜像,通过Docker Compose预拉取与验证,隔离环境问题与算法问题;并延伸至K8s节点预拉镜像,规避ImagePullBackOff故障,提升部署可靠性与复用性。(239字)