《达摩院2023十大科技趋势》——产业革新——计算光学成像

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 《达摩院2023十大科技趋势》——产业革新——计算光学成像

趋势八、计算光学成像


计算光学成像突破传统光学成像极限,将带来更具创造力和想 象力的应用。


摘要


计算光学成像是一个新兴多学科交 叉领域。它以具体应用任务为准则,通 过多维度获取或编码光场信息(如角度、 偏振、相位等),为传感器设计远超人 眼的感知新范式;同时,结合数学和信 号处理知识,深度挖掘光场信息,突破 传统光学成像极限。目前,计算光学成 像处于高速发展阶段,已取得许多令人 振奋的研究成果,并在手机摄像、医疗、 无人驾驶等领域开始规模化应用。未来, 计算光学成像有望进一步颠覆传统成像 体系,带来更具创造力和想象力的应用, 如无透镜成像、非视域成像等。


image.png

趋势解读


传统光学成像建立在几何光学基础 上,借鉴人眼视觉“所见即所得” 的原理,而忽略了诸多光学高维信息。 当前传统光学成像在硬件功能、成像性 能方面接近物理极限,在众多领域已无 法满足应用需求。例如 ,在手机摄影领 域,无法在保证成像效果的同时缩小器 件重量和体积,出现令人诟病的“前刘 海”和“后浴霸”的情况;在显微成像领 域,无法同时满足宽视场和高分辨率的 需求;在监控遥感领域,难以在光线较 暗、能见度较低的复杂环境中获得清晰 图像……


随着传感器、云计算、人工智能等 新一代信息技术的不断演进,新型解决 方案逐步浮出水面——计算光学成像。 计算光学成像以具体应用任务为准则, 通过多维度获取或编码光场信息(如角 度、偏振、相位等),为传感器设计远 超人眼的感知新范式;同时,结合数学 和信号处理知识,深度挖掘光场信息, 突破传统光学成像极限(如图1 所示)。


image.png


计算光学成像是一个新兴多学科交 叉领域 , 早期概念在上个世纪 70 年代中 期才逐步形成。随着信息技术的蓬勃发 展,计算光学成像已成为国际研究热点。 由于计算光学成像研究内容覆盖范围广, 目前还没有一个比较明确的分类方法。 按照计算成像技术所解决的应用问题来 分类,可以大致分为以下三类:(1)功 能提升:对传统方式无法获取的光学信 息,如光场、偏振、相干度等进行成像 或测量;(2)性能提升:即提升现有成 像技术的性能指标,如空间分辨率、时 间分辨率、景深、复杂环境鲁棒性等;(3) 简化与智能化:通过单像素、无透镜等 特定技术简化成像系统,或者以光速实 现特定人工智能任务(如图 2 所示)。


image.png


计算光学成像技术现处于高速发展 阶段,还需克服诸多挑战:首先,需以 传感器为中心重新设计光学系统;其次, 由于需要获取多维度光学信息,需引入 新型光学器件和光场调控机制,随之而 来的是更多的硬件成本和研发 / 调试时 间成本;再次,为了使计算成像硬件和 软件有更好的协同,则需重新开发算法 工具;最后,对算力要求非常高,对应 用设备芯片及其适配性提出更高要求。


计算光学成像虽然是一个新兴技 术,但已取得了很多令人振奋的研究成 果(2014 诺贝尔奖——超分辨荧光显微 成像、2017 年诺贝尔奖——冷冻电镜), 并在手机摄像、医疗、监控、工业检测、 无人驾驶等领域开始规模化应用。如在 手机摄像领域,主流手机厂商均初步融 入了计算光学成像思路,从比拼硬件光 学,转而追求硬件加算法的协同;目前 手机摄像在相当一部分场景的拍摄效果 达到、甚至超过一般单反相机。


未 来, 计 算 光 学 成 像 将 进 一 步 颠 覆传统成像体系,带来更具创造力和 想象力的应用。元成像芯片可实现大 范围无像差三维感知,有望彻底解决手 机后置摄像头突出的问题。无透镜成像 (FlatCam)能够简化传统基于透镜的相 机成像系统,进一步减小成像系统体积 并有望用于各类可穿戴设备。此外,利 用偏振成像技术能够透过可见度不高的 介质清晰成像,实现穿云透雾。还有非 视域成像,能够通过记录并解析光传播 的高速过程来对非视域下目标进行有效 探测,实现隔墙而视,在反恐侦察、医 疗检测等领域具有广泛的应用价值。


专家点评


在过去的十多年来, 信息技术的高速发 展为光学成像注入 了 新 的 生 命, 计 算 成 像 应 运 而 生, 悄 无声息中颠覆了人 类与机器感知世界 的方式。从“所见即 所得”的一一映射到 对高维光场的耦合 编 码 与 计 算 重 构, 计算成像将光作为 信息载体的一部分, 模糊了物理世界与 数 字 世 界 的 边 界, 从而突破了物理约 束,见所未见。从此, 我们能够捕捉光传 播 的 轨 迹, 看 到 千 里 之 外 的 声 音, 解 析生命活动的奥秘, 穿 云 透 雾, 洞 察 秋 毫。从毫厘微末间的 细 胞 病 毒, 到 广 袤 宇宙中的第一缕光, 计算成像将不断开 拓人类的认知边界; 从无人系统手机摄 影, 到 工 业 监 测 安 防 监 控, 计 算 成 像 将融入人们生活的 方 方 面 面, 推 动 数 字经济高速发展。


吴嘉敏

清华大学自动化系 助理教授

相关文章
|
SQL 数据可视化 关系型数据库
5个实用的SQLite数据库可视化工具(GUI)
5个实用的SQLite数据库可视化工具(GUI)
2849 3
halcon的灰度变换(图像增强)
halcon的灰度变换(图像增强)
938 1
|
NoSQL 关系型数据库 MySQL
如何向mongoDB中添加新的字段附代码(全)
关于MongoDB更多的知识点可看我之前这篇文章: MongoDB框架零基础入门本身MongoDB的连接就和Mysql的数据库一样 Mysql连接方式:mysql -u -root -p(标准模式下) MongoDB类似:mongo -u root -p之所以要增加字段值 一般都是python web框架中,在form表单内增加了一个字段值写入数据库(只有最新的数据才有这个字段值) 之前数据没有的字段值只能通过数据库添加 具体添加方式可以通过数据库内或者脚本一键添加(两种方式都差不多)在数据库内增加字段值
713 0
|
3月前
|
人工智能 弹性计算 JSON
再不玩通义VACE模型你就过时了!一个模型搞定所有视频任务
阿里巴巴开源通义万相Wan2.1-VACE,业界功能最全的视频生成与编辑模型,支持文生视频、图像参考生成、视频重绘、局部编辑、背景延展等,统一模型实现多任务自由组合,轻量版本消费级显卡即可运行。
|
API Android开发 数据中心
教你如何申请免费的API接口
教你如何申请免费的API接口
2366 0
教你如何申请免费的API接口
|
11月前
|
JavaScript 前端开发 C++
关于Vue2里 v-for和v-if一起用的时候会出现的问题
本文介绍了在Vue2中同时使用`v-for`和`v-if`指令时可能出现的问题及解决方案。由于`v-for`的优先级高于`v-if`,导致条件判断在每次循环中执行,可能造成重复渲染。文中通过具体案例展示了问题现象,并提供了两种解决方法:一是调整逻辑,将列表长度小于等于2时清空列表;二是修改条件判断,避免使用`v-else`,确保每个条件独立判断。最后,作者建议使用Vue3以获得更好的性能和体验。
359 1
关于Vue2里 v-for和v-if一起用的时候会出现的问题
|
12月前
|
JavaScript
ThreeJs模拟工厂生产过程八
这篇文章详细介绍了如何在Three.js中模拟工厂生产过程的第八部分,重点是优化场景中的模型,包括合并货架上的料箱以减少渲染负担,并替换设备模型以增强场景的真实性和互动性。
182 0
|
敏捷开发 持续交付 开发者
敏捷开发:拥抱变化,持续交付价值的艺术(一)
敏捷开发:拥抱变化,持续交付价值的艺术(一)
344 0
敏捷开发:拥抱变化,持续交付价值的艺术(一)
|
存储 小程序 前端开发
微信小程序健康管理系统的开发与实现
微信小程序健康管理系统的开发与实现
364 0
|
算法 安全 数据安全/隐私保护
XTEA加密算法实现过程
XTEA加密算法实现过程
315 0