Nature封面:AI提高自动驾驶夜视能力,检测黑夜、雾天场景和白天一样

简介: Nature封面:AI提高自动驾驶夜视能力,检测黑夜、雾天场景和白天一样

未来,HADAR 可能会彻底改变自动驾驶汽车和机器人感知周围世界的方式。


环境感知是自动驾驶领域非常重要的一项任务。特别是在夜晚或者极端天气的情况下,现有的视觉感知和激光雷达两种方式对环境的感知和识别都效果不佳。这给自动驾驶等高风险应用带来了挑战。

有些研究提出使用热像仪来弥补 LiDAR 和视觉摄像头的缺陷。但由于物体不断发出热辐射,粒子会扩散到附近的环境中,导致热成像变得模糊、无纹理,形成「鬼影ghost)」,使这种方法难以实际应用。

现在,一种新的热成像技术可以不受雾、烟和黑暗等视觉障碍的影响,使得自动驾驶汽车在黑暗中也能准确感知环境。如下图所示,与以前的热成像(上)相比,新方法可以创建更清晰、更有质感的夜间图像(中和下)。


这种新方法是由来自普渡大学等机构的研究者提出,他们开发了一种新的系统, 称为「热辅助探测和测距系统(HADAR)」。借助该系统,我们可以在环境不佳的情况下获得精细的环境图像,细节与精度和传统相机在明亮日光下拍摄的图像相当。研究论文已登上 Nature 封面。


论文地址:https://www.nature.com/articles/s41586-023-06174-6

方法介绍

HADAR 能够穿透光学杂波来检测物体的温度、材料成分和热辐射模式,而不受雾、烟和黑暗等视觉障碍的影响。因此,无论一天中的时间或环境如何,HADAR 基于对深度和纹理的渲染都能创建极其详细、清晰的图像。

HADAR 与「鬼影」热成像。

为了训练 HADAR 系统,研究人员在夜间使用先进的热成像相机和能够显示电磁波谱中能量辐射的成像传感器,在户外捕获数据。他们还创建了对户外环境的计算机模拟,以便进行额外的 AI 训练。

普渡大学电气与计算机工程系教授、本文作者之一 Zubin Jacob 表示,「HADAR 学会了探测物体并估计与这些物体的距离,其精度是仅依靠传统夜视技术的 10 倍。而且,HADAR 在夜间的性能与传统物体检测系统在白天的性能相当。」

「声纳、雷达和激光雷达等会发出信号并返回反射,以推断物体是否存在及其与物体的距离。除了相机所拥有的视觉能力之外,它们还提供了场景的额外信息,尤其是在环境照明较差的情况下,」Jacob 表示,「然而,HADAR 有着根本的不同,它利用不可见的红外辐射来重建夜间场景,清晰度就像白天一样。」

在没有反射光的黑暗环境中, 传统摄像头无法很好地捕捉图像,雷达和激光雷达也容易受到干扰。

热成像技术通过捕获环境中物体辐射的红外光来重建场景。如下图所示,新研究提出的 HADAR 方法改变了机器感知的方式:


为了解决「鬼影」问题,该研究训练了一个神经网络,用于对热像仪发出的红外信号进行分类,将物体的特征热信号与导致「鬼影」的环境噪音分开。

该研究训练算法来识别已知材料(例如玻璃、木材或织物)的独特发射光谱。通过识别场景中的这些已知特征,算法可以表征其观察到的对象。那么剩下的就是环境信号和从这些物体反射到相机中的噪声。通过向后评估噪声信号的反射和散射方式,该算法可以填充每个对象的纹理信息,从而为图像提供更高层次的细节。


处理后的图像清晰地显示了物体及其纹理,并且可以识别物体的材质。最重要的是,HADAR 还能够提供一种关键数据 —— 环境物体的深度信息,这将有助于自动驾驶在复杂路况下进行环境感知。

下图展示了一个 HADAR 的应用实例。其中有一位真人和一个人形纸板。RGB 光学成像和稀疏 LiDAR 点云都无法区分真人和人形纸板,并且 LiDAR 还难以检测到夜间条件下的车辆。而 HADAR 检测到相应材料区域(皮肤 + 织物)中的人,将其与纸板清楚地区分开来,克服了「幻象制动」问题。

下图 6 展示了 HADAR 测距在夜间击败了最先进的热测距技术:

由于该方法能够确定场景中的物体是由什么组成的,因此与传统成像技术相结合,即使在白天,HADAR 也可以提供有关场景的独特信息。

研究团队表示希望这项技术能够得到广泛应用,从自动驾驶到帮助生物学家远程追踪野生动物。

参考链接:https://www.science.org/content/article/ai-brings-clarity-fuzzy-night-vision-imageshttps://www.newscientist.com/article/2384435-driverless-cars-could-get-ai-powered-heat-vision-for-nighttime-driving/https://www.popsci.com/technology/hadar-thermal-camera/


目录
打赏
0
0
0
0
367
分享
相关文章
ProtGPS:MIT再造生命科学新基建!蛋白质AI一键预测定位+设计新序列,登Nature子刊
ProtGPS 是麻省理工学院和怀特黑德研究所联合开发的蛋白质语言模型,能够预测蛋白质在细胞内的亚细胞定位,并设计具有特定亚细胞定位的新型蛋白质。
77 17
ProtGPS:MIT再造生命科学新基建!蛋白质AI一键预测定位+设计新序列,登Nature子刊
Koordinator v1.6: 支持AI/ML场景的异构资源调度能力
如何高效管理和调度这些资源成为了行业关注的核心问题。在这一背景下,Koordinator积极响应社区诉求,持续深耕异构设备调度能力,并在最新的v1.6版本中推出了一系列创新功能,帮助客户解决异构资源调度难题。
34 16
九牧的“AI梦想曲”:卫浴场景进入到机器人时代
十年后的卫浴空间将不再仅仅是功能性场所,而是进化为个性化健康管理中枢。据DeepSeek预测,未来卫浴将引入全自动清洁与管理机器人、个性化健康管家等智能设备,成为家庭中的“第四生活伙伴”。九牧集团等企业已开始布局这一领域,启动AI马桶与家用机器人产业园建设,致力于打造智能卫浴产品,如机器人洗澡机、健康马桶等。这些创新不仅提升了用户体验,还标志着卫浴行业正迈向AI与机器人新时代,引领全球制造业变革。
闭门沙龙,深度交流!12月26日来「AI火花会」上海场,共话AI教育落地「真」场景
闭门沙龙,深度交流!12月26日来「AI火花会」上海场,共话AI教育落地「真」场景
DynamicCity:上海AI Lab开源4D场景神器助力自动驾驶场景!128帧动态LiDAR生成,1:1还原城市早晚高峰
DynamicCity 是上海 AI Lab 推出的 4D 动态场景生成框架,专注于生成具有语义信息的大规模动态 LiDAR 场景,适用于自动驾驶、机器人导航和交通流量分析等多种应用场景。
36 1
斯坦福伯克利重磅发现DNA Scaling Law,Evo荣登Science封面!AI设计DNA/RNA/蛋白质再突破
近日,斯坦福大学和加州大学伯克利分校在《科学》杂志发表重要成果,发现DNA Scaling Law规律,揭示了DNA、RNA和蛋白质分子长度与碱基对数量之间的比例关系。该研究为AI设计生物分子带来突破,通过数据收集、模型训练和优化设计等步骤,显著提高设计效率和准确性,降低成本,并拓展应用范围。论文地址:https://www.science.org/doi/10.1126/science.ado9336。
72 26
预定下一个诺奖级AI?谷歌量子纠错AlphaQubit登Nature,10万次模拟实验创新里程碑
谷歌的量子纠错算法AlphaQubit近日登上《自然》杂志,被誉为量子计算纠错领域的重大突破。量子比特易受环境噪声干扰,导致计算错误,而AlphaQubit通过神经网络学习噪声模式,显著提升纠错准确性。实验结果显示,它在Sycamore处理器和Pauli+模拟器上表现优异,优于现有解码算法。尽管面临资源需求高等挑战,AlphaQubit为实用化量子计算带来新希望,并可能推动其他领域创新。论文详见:https://www.nature.com/articles/s41586-024-08148-8
46 5
与1.0 相比,通义灵码 2.0 AI 程序员有哪些功能、亮点、优势、场景?
通义灵码2.0相比1.0新增了工程级编码任务、单元测试生成和图片多模态问答等功能,支持多文件代码修改、批量生成单元测试及根据图片内容生成代码建议。亮点包括支持主流IDE、垂直智能体覆盖更多场景、企业级检索增强和灵活对话交互体验。技术优势涵盖多模态上下文感知、快速推理、企业数据个性化及一流代码生成效果。典型应用场景有新功能开发、跨语言编程、单元测试自动生成和错误排查修复。
286 7
AI 场景下,函数计算 GPU 实例模型存储最佳实践
AI 场景下,函数计算 GPU 实例模型存储最佳实践

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等