智能驾驶感知环境容器镜像预检记录

简介: 本文介绍智能驾驶感知环境部署前的镜像预检实践:针对CUDA、ROS2、PyTorch、Prometheus、K8s等多源异构镜像,通过Docker Compose预拉取与验证,隔离环境问题与算法问题;并延伸至K8s节点预拉镜像,规避ImagePullBackOff故障,提升部署可靠性与复用性。(239字)

这次做智能驾驶感知环境复现,我先做了一轮镜像预检。

原因很简单:环境里有 CUDA、ROS2、PyTorch、Prometheus 和 K8s 基础组件,镜像来源不在一个地方。直接启动服务,容易把镜像问题和算法问题混在一起。

预检目标

先确认这些容器能拉下来:

docker pull docker.1ms.run/osrf/ros:humble-desktop
docker pull docker.1ms.run/pytorch/pytorch:2.5.1-cuda12.4-cudnn9-runtime
docker pull nvcr.1ms.run/nvidia/cuda:12.4.1-runtime-ubuntu22.04
docker pull quay.1ms.run/prometheus/prometheus:v2.54.1

这一步只验证镜像链路,不看模型效果。

compose 记录

services:
  ros-bag-runner:
    image: docker.1ms.run/osrf/ros:humble-desktop

  infer-worker:
    image: docker.1ms.run/pytorch/pytorch:2.5.1-cuda12.4-cudnn9-runtime

  cuda-check:
    image: nvcr.1ms.run/nvidia/cuda:12.4.1-runtime-ubuntu22.04
    command: ["nvidia-smi"]

  metrics:
    image: quay.1ms.run/prometheus/prometheus:v2.54.1

执行:

docker compose pull
docker compose up -d

如果这里失败,先不要看推理代码。

K8s 预拉

后面如果要放到 K8s,新节点先做:

crictl pull k8s.1ms.run/pause:3.9
crictl pull k8s.1ms.run/coredns/coredns:v1.10.1
crictl pull nvcr.1ms.run/nvidia/cuda:12.4.1-runtime-ubuntu22.04
crictl pull quay.1ms.run/prometheus/prometheus:v2.54.1

这样可以提前排掉 ImagePullBackOff 这类问题。

复盘

智能驾驶感知环境里,真正耗时间的不一定是代码调试,很多时候是 CUDA、推理框架、数据回放、监控组件这些基础容器没有先稳定下来。

我这次的顺序是:

  1. 先列镜像;
  2. 按来源预拉;
  3. 固定 compose;
  4. K8s 节点预拉;
  5. 容器正常后再看模型和数据。

这个顺序适合之后复用。

相关文章
|
2月前
|
运维 Kubernetes 应用服务中间件
CI/CD流水线镜像拉取耗时从47分钟降到2分钟,我做了这几件事
换镜像加速源,CI/CD构建从47分钟骤降至2分钟!非代码/硬件优化,仅切换为毫秒镜像(1ms.run)——全源加速(Docker Hub、GHCR、k8s.gcr等),30台服务器10分钟批量配置,失败率归零,凌晨发布成功率100%。
280 16
|
2月前
|
安全 JavaScript 前端开发
React2Shell 漏洞自动化凭证窃取攻击机理与防御研究
CVE-2025-55182(React2Shell)是CVSS 10.0的高危RCE漏洞,可无认证、无交互远程接管Next.js等RSC应用服务器。2026年已爆发规模化自动化凭证窃取攻击,单日入侵766台服务器。本文系统剖析漏洞机理与攻击链,构建检测、监控、防御、响应一体化闭环体系,提供可落地的代码与方案。(239字)
255 16
|
2月前
|
人工智能 安全 Linux
OpenClaw 对接阿里云百炼 API:本地 AI 助手快速部署指南
本文详解如何将轻量开源AI助手OpenClaw与阿里云百炼平台快速对接:通过配置兼容OpenAI接口、设置API密钥及模型参数,仅需数步即可本地调用通义千问系列大模型(如qwen-plus、qwen3-max),实现安全、可控、低门槛的智能助手部署。
582 14
|
30天前
|
SQL Java 中间件
读写分离与查询路由实战:从原理到Spring Boot代码实现
本文由“数据库小学妹”详解读写分离与查询路由实战:基于Spring Boot + 动态数据源(AbstractRoutingDataSource + AOP)实现主从库自动分流;对比ShardingSphere等中间件方案;涵盖强制读主、延迟感知、负载均衡等路由策略及避坑指南。
|
1天前
|
自然语言处理 前端开发 安全
2026 世界杯钓鱼即服务平台攻击机理与防御体系研究
2026世界杯前夕,“Ghost Stadium”中文钓鱼即服务平台发动大规模攻击,涉案4.7–10亿美元,受害超4.7万人,窃取FIFA凭证2500+条,注册恶意域名超4000个。该平台采用React+Layui实现像素级克隆、SSO模拟与多语言适配,构建覆盖社交广告、搜索、IM的立体攻击网络。本文基于实证分析,提出检测、响应、溯源、治理闭环防御体系,强调跨机构协同与动态对抗。(239字)
146 10
|
2月前
|
编解码 缓存 API
【开源剪映小助手】草稿管理接口
本文档详解剪映草稿管理三大核心API:创建、保存及获取草稿文件列表,涵盖请求参数、响应格式、错误码、URL规则与最佳实践,助力开发者快速集成稳定高效的草稿系统。(239字)
|
2月前
|
数据采集 运维 监控
绝缘子位置检测数据集(2000张)|YOLOv8训练数据集 电力巡检 无人机检测 输电线路监测 智能运维
本数据集含2000张真实电力巡检图像,专为YOLOv8训练优化,聚焦绝缘子位置检测。覆盖山区、城市等多场景及晴/雾/逆光等复杂条件,采用单类别高精度YOLO格式标注,结构标准、即拿即用,助力无人机巡检、智能运维与输电线路安全监测。
241 11
|
1月前
|
网络安全 开发工具 git
Gogs: 打造属于你自己的轻量级 Git 服务
Gogs 是一个小而美的 Git 服务解决方案。无论你是想在个人服务器上搭建私有的代码仓库,还是为小团队提供一个轻量级的代码协作平台,Gogs 都是一个值得考虑的选择。
184 8
Gogs: 打造属于你自己的轻量级 Git 服务
|
1天前
|
存储 人工智能 安全
|
1天前
|
前端开发
记忆面包:QoderWork CN 把厚书读薄
本案例基于阿里QoderWork CN桌面应用,通过安装“UI设计”技能,将学习笔记一键转化为含填空、选择、判断等题型的交互式复习卡片,支持HTML导出,大幅提升备考效率。
581 9