《达摩院2023十大科技趋势》——产业革新——计算光学成像

简介: 《达摩院2023十大科技趋势》——产业革新——计算光学成像

趋势八、计算光学成像


计算光学成像突破传统光学成像极限,将带来更具创造力和想 象力的应用。


摘要


计算光学成像是一个新兴多学科交 叉领域。它以具体应用任务为准则,通 过多维度获取或编码光场信息(如角度、 偏振、相位等),为传感器设计远超人 眼的感知新范式;同时,结合数学和信 号处理知识,深度挖掘光场信息,突破 传统光学成像极限。目前,计算光学成 像处于高速发展阶段,已取得许多令人 振奋的研究成果,并在手机摄像、医疗、 无人驾驶等领域开始规模化应用。未来, 计算光学成像有望进一步颠覆传统成像 体系,带来更具创造力和想象力的应用, 如无透镜成像、非视域成像等。


image.png

趋势解读


传统光学成像建立在几何光学基础 上,借鉴人眼视觉“所见即所得” 的原理,而忽略了诸多光学高维信息。 当前传统光学成像在硬件功能、成像性 能方面接近物理极限,在众多领域已无 法满足应用需求。例如 ,在手机摄影领 域,无法在保证成像效果的同时缩小器 件重量和体积,出现令人诟病的“前刘 海”和“后浴霸”的情况;在显微成像领 域,无法同时满足宽视场和高分辨率的 需求;在监控遥感领域,难以在光线较 暗、能见度较低的复杂环境中获得清晰 图像……


随着传感器、云计算、人工智能等 新一代信息技术的不断演进,新型解决 方案逐步浮出水面——计算光学成像。 计算光学成像以具体应用任务为准则, 通过多维度获取或编码光场信息(如角 度、偏振、相位等),为传感器设计远 超人眼的感知新范式;同时,结合数学 和信号处理知识,深度挖掘光场信息, 突破传统光学成像极限(如图1 所示)。


image.png


计算光学成像是一个新兴多学科交 叉领域 , 早期概念在上个世纪 70 年代中 期才逐步形成。随着信息技术的蓬勃发 展,计算光学成像已成为国际研究热点。 由于计算光学成像研究内容覆盖范围广, 目前还没有一个比较明确的分类方法。 按照计算成像技术所解决的应用问题来 分类,可以大致分为以下三类:(1)功 能提升:对传统方式无法获取的光学信 息,如光场、偏振、相干度等进行成像 或测量;(2)性能提升:即提升现有成 像技术的性能指标,如空间分辨率、时 间分辨率、景深、复杂环境鲁棒性等;(3) 简化与智能化:通过单像素、无透镜等 特定技术简化成像系统,或者以光速实 现特定人工智能任务(如图 2 所示)。


image.png


计算光学成像技术现处于高速发展 阶段,还需克服诸多挑战:首先,需以 传感器为中心重新设计光学系统;其次, 由于需要获取多维度光学信息,需引入 新型光学器件和光场调控机制,随之而 来的是更多的硬件成本和研发 / 调试时 间成本;再次,为了使计算成像硬件和 软件有更好的协同,则需重新开发算法 工具;最后,对算力要求非常高,对应 用设备芯片及其适配性提出更高要求。


计算光学成像虽然是一个新兴技 术,但已取得了很多令人振奋的研究成 果(2014 诺贝尔奖——超分辨荧光显微 成像、2017 年诺贝尔奖——冷冻电镜), 并在手机摄像、医疗、监控、工业检测、 无人驾驶等领域开始规模化应用。如在 手机摄像领域,主流手机厂商均初步融 入了计算光学成像思路,从比拼硬件光 学,转而追求硬件加算法的协同;目前 手机摄像在相当一部分场景的拍摄效果 达到、甚至超过一般单反相机。


未 来, 计 算 光 学 成 像 将 进 一 步 颠 覆传统成像体系,带来更具创造力和 想象力的应用。元成像芯片可实现大 范围无像差三维感知,有望彻底解决手 机后置摄像头突出的问题。无透镜成像 (FlatCam)能够简化传统基于透镜的相 机成像系统,进一步减小成像系统体积 并有望用于各类可穿戴设备。此外,利 用偏振成像技术能够透过可见度不高的 介质清晰成像,实现穿云透雾。还有非 视域成像,能够通过记录并解析光传播 的高速过程来对非视域下目标进行有效 探测,实现隔墙而视,在反恐侦察、医 疗检测等领域具有广泛的应用价值。


专家点评


在过去的十多年来, 信息技术的高速发 展为光学成像注入 了 新 的 生 命, 计 算 成 像 应 运 而 生, 悄 无声息中颠覆了人 类与机器感知世界 的方式。从“所见即 所得”的一一映射到 对高维光场的耦合 编 码 与 计 算 重 构, 计算成像将光作为 信息载体的一部分, 模糊了物理世界与 数 字 世 界 的 边 界, 从而突破了物理约 束,见所未见。从此, 我们能够捕捉光传 播 的 轨 迹, 看 到 千 里 之 外 的 声 音, 解 析生命活动的奥秘, 穿 云 透 雾, 洞 察 秋 毫。从毫厘微末间的 细 胞 病 毒, 到 广 袤 宇宙中的第一缕光, 计算成像将不断开 拓人类的认知边界; 从无人系统手机摄 影, 到 工 业 监 测 安 防 监 控, 计 算 成 像 将融入人们生活的 方 方 面 面, 推 动 数 字经济高速发展。


吴嘉敏

清华大学自动化系 助理教授

相关文章
|
6月前
|
缓存 算法 API
从 0 实现 API 接口签名验证系统:基于 HMAC-SHA256 的防篡改方案(附 Python 全代码)
本文介绍基于 的 API 接口签名验证系统,实现防篡改与防重放攻击,包含完整设计原理、签名生成规则及可运行的 Python 客户端与服务端代码,并提供安全性优化与部署建议。
|
存储 数据采集 大数据
AllData数据中台技术架构升级演进
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
AllData数据中台技术架构升级演进
|
11月前
|
人工智能 前端开发 JavaScript
智能编码在前端研发的创新应用
在前端开发领域,智能编码技术正引领一场变革,通过大模型的强大能力将自然语言需求直接转化为高效、可靠的代码实现。
436 10
|
安全
在钉钉中,钉钉的回调事件怎么接入?
在钉钉中,钉钉的回调事件怎么接入?
602 1
|
Ubuntu 安全 Linux
Linux的安装过程
Linux的安装过程
492 6
|
机器学习/深度学习 人工智能 调度
【AI系统】推理引擎架构
本文详细介绍了推理引擎的基本概念、特点、技术挑战及架构设计。推理引擎作为 AI 系统中的关键组件,负责将训练好的模型部署到实际应用中,实现智能决策和自动化处理。文章首先概述了推理引擎的四大特点:轻量、通用、易用和高效,接着探讨了其面临的三大技术挑战:需求复杂性与程序大小的权衡、算力需求与资源碎片化的矛盾、执行效率与模型精度的双重要求。随后,文章深入分析了推理引擎的整体架构,包括优化阶段的模型转换工具、模型压缩、端侧学习等关键技术,以及运行阶段的调度层、执行层等核心组件。最后,通过具体的开发流程示例,展示了如何使用推理引擎进行模型的加载、配置、数据预处理、推理执行及结果后处理。
1283 0
|
前端开发
HTML网页作业代码(仿写商城首页、学校官网网页等、源码可直接运行)
这篇文章提供了HTML网页作业的完整代码,包括仿写商城首页和学校官网网页的源码,以及如何运行和项目结构等详细信息。
HTML网页作业代码(仿写商城首页、学校官网网页等、源码可直接运行)
|
存储 缓存 文件存储
如何保证分布式文件系统的数据一致性
分布式文件系统需要向上层应用提供透明的客户端缓存,从而缓解网络延时现象,更好地支持客户端性能水平扩展,同时也降低对文件服务器的访问压力。当考虑客户端缓存的时候,由于在客户端上引入了多个本地数据副本(Replica),就相应地需要提供客户端对数据访问的全局数据一致性。
32368 78
如何保证分布式文件系统的数据一致性
|
存储 人工智能 达摩院
《达摩院2023十大科技趋势》——序言
《达摩院2023十大科技趋势》——序言
657 1
|
小程序
仿qq音乐播放微信小程序模板源码
手机qq音乐应用小程序,在线音乐播放器微信小程序网页模板。包含:音乐歌曲主页、推荐、排行榜、搜索、音乐播放器、歌单详情等。
308 1

热门文章

最新文章