MIT黑科技:“不开卷也有益”,计算机不翻书就能读完一本书

简介:

编者按:第一眼看到文章的标题,大家肯定会不约而同地想到:“Isn’t it amzing that computers can read through a book page by page without opening it”?讲真,我们文章的作者,来自MIT Media Lab的A. R. Sanchez, B. Heshmat, A. Aghasi等研究员们,将为大家详细讲述如何运用太赫兹时栅光谱成像技术从层状结构中,如一本闭合着的富有文化价值的古籍,提取文本内容不同于X射线或超声波,该成像技术能够区分页与页之间、空白页与有文字的页之间的差异,透读9页纸张上的内容。目前,研究员们正在继续努力,以期实现技术上的突破,提升该项技术在工业、文化遗产研究等领域的实际应用。

 在传统意义上,飞行时间成像技术一般应用于快速成像(飞秒摄影Femto photography)和复杂的几何图形成像(如在拐角处或漫射器内成像)。由于光速将时间与空间紧密联系在一起,时间分辨率越高,空间分辨率也将随之增加。在我们的最新研究中,我们将从100千兆赫兹到3太赫兹范围内甄选出一个能够穿透纸张或其他材料的频段。我们也将对具有很高时间分辨率(每秒10兆帧)的光脉冲进行取样,取样所得的光脉冲是我们之前的研究中所用光脉冲的20多倍。如此高的时间分辨率将空间分辨率提升到30微米左右,使将一本合着的书的页与页之间分开来成为可能。我们提出了一种扩展算法使这种成像方式(可以称之为太赫兹时间域光谱技术)既能够成像,也能够透读密集的层状结构。这种成像技术当然在工业检测中能够得到应用,不过,也能够用于透读闭合着的古老文件或者检查富有文化价值的书籍样本。

对一些复杂样本,如闭合的书籍,进行非侵入性检查当前所面临的三大成像技术瓶颈为:空间分辨率,光谱对比度和遮挡。我们运用传统太赫兹时间域光谱学技术的飞行时间能力,并结合其光谱能力,力图在算法上克服这些技术瓶颈。据我们的研究报道,能够成功地无监督式提取一个类似于一本闭合的书籍的密集层状结构所包含的内容。

基于反射所得的太赫兹电场的统计结果,我们的技术使用类似飞行时间的测量方法来定位书中的每一页。层定位结束后,我们运用一种新型时栅光谱分析方法,这种分析方法能够调整每一页的频率,使之对应光谱域中对比度最高的帧。随着页码的增加,我们采用的研究方法能够产生一种等级凸显效果,为每一页排序。当使用一种最近才提出的能够识别出每一页被遮挡的字母的方法后,整个成像过程便宣告结束。实验结果表明,我们已经能够成功地从一扎至少9页带有文字的纸张中提取出字母。

由于工业界有不计其数的层状结构,每层的厚度大约有亚毫米,和数不清的富有文化价值的文本(如文件,书籍和艺术作品),运用THz TDS(太赫兹时间域光谱技术)从层状结构中提取内容具有广阔的应用前景。因此,我们的研究将有助于改进THz和其他用于从层状结构中提取内容的时间分辨率成像技术。

我们的研究证实了太赫兹时栅成像技术在提取深度内容方面的实际应用,并且为成像与传感领域的研究指明了新的研究方向。我们的研究结果报告如下:

MIT黑科技:“不开卷也有益”,计算机不翻书就能读完一本书

1. 与传统的去卷积技术相比,THz TDS的电场统计结果能够提高较深层层定位的精确度。此外,这种技术在提取脉冲方面的应用并不依赖一种参考测量标准。

2. 太赫兹时间域光谱技术具备的飞行时间能力或时间分辨率主要能够用于在空间内分辨3D光谱特征(而并非用于对整个样本作纯粹的变换谐波量分析)。这将有助于我们调整文本内部和空白页之间微小的光谱差异,以达到凸显文本的目的。

3. 目前提出的计算方法,如基本凸形状分解,能够通过精确恢复被遮挡的内容,从而得到全新的应用。

MIT黑科技:“不开卷也有益”,计算机不翻书就能读完一本书

此外,我们的技术对以下三个领域产生了重大影响——超快成像,计算成像和太赫兹光谱成像。我们期望,我们的研究结果将激发广大读者对于太赫兹时栅成像技术的浓厚兴趣,同时为其检查层状结构和层状结构成像搭建一个新的平台。本研究将对工业成像、地震成像领域的研究和文化遗产研究产生深远的影响。此外,由于这种成像方式是以映像的形式为依托的,它的应用将拓展到运用其他类型飞行时间传感器的远距离成像研究中。

读者可能对与本文相关的一些问题感兴趣,我们在这里简要提及四个:

1. 我们的研究与camera future的“每秒兆帧成像”研究项目有什么联系?

我们运用相似的超快成像方法定位每一页。基于测量所得的太赫兹脉冲达到的时间,我们计算出每一页的位置,然后观察脉冲的光谱,以确定该页的某个位置是否有墨迹。Camera future 的“每秒兆帧成像”项目是首个将物理学中常用的超快设置方法运用到成像系统与应用的项目。

2. 难道X射线或超声波不能实现从层状结构中快速提取内容吗?

似乎,X射线或超声波也能够实现读通书本,成像;但是,与我们的THz技术相比,这类技术在亚微型钢笔墨水或铅笔层与空白页之间不能形成对比对。这类方法也有其他的缺点,如花费高和电离辐射。如果运用CT的话,将很难检测出一本闭合的书籍中页与页之间的差异,因而不能看到文本内容。然而,我们的远红外时间分辨系统是基于纸张吸收光谱的,这种成像技术将成为唯一一种用于逐张提取文本内容的技术。

3.  该THz TDS成像技术的创新之处体现在哪里?

该技术的核心贡献在于:

      1、运用THz信号统计结果提取一层文本内容。与传统的方法相比较,这种新技术能够运用于更多也输得内容提取。

      2、运用Kurtosis的光谱对比度来调整空白纸与有墨迹的纸张频率域之间的细微差异。

      3、凸基本形状匹配,能够检测出被遮挡的字母。

      4、我们应用上述提到的所有技术,以便采用计算方法并利用THz时间域光谱系统的光谱分辨率与时间分辨率实现新的应用。

4. 该技术的局限性体现在哪里?

SNR与光谱对比是当前的主要技术瓶颈;一个具备更高性能的系统将有助于我们“更深地”读书。另一局限性在于薄纸张的变形,纸张变形将导致信号的扭曲,近来我们的研究有志于解决这一难题。

原文链接

via A. R. Sanchez et al.

本文由雷锋网(公众号:雷锋网)独家编译,未经允许拒绝转载!


本文作者:高婓


本文转自雷锋网禁止二次转载,原文链接

相关文章
|
存储 弹性计算 负载均衡
阿里云游戏服务器租用配置选型攻略
游戏服务器租用首先要考虑的是云服务器ECS规格、大带宽、数据存储能力及游戏服务器防御能力
2291 1
|
XML 编解码 编译器
Unity跨平台UI解决方案:可能是最全的FairyGUI系列教程-第八天
众所周知,人生是一个漫长的流程,不断克服困难,不断反思前进的过程。在这个过程中会产生很多对于人生的质疑和思考,于是我决定将自己的思考,经验和故事全部分享出来,以此寻找共鸣!!!
2214 0
|
项目管理 数据安全/隐私保护 Python
使用poetry来更优雅的管理 python 包
Poetry 的优势在于它提供了一个统一的工具来处理 Python 项目的整个生命周期,从依赖管理到打包和发布。它的依赖解析器非常强大,能够有效地处理复杂的依赖关系。此外,Poetry 还提供了一个直观的命令行界面,使得项目管理变得更加简单。 对于团队协作和项目部署来说,Poetry 的依赖锁定功能(通过 poetry.lock 文件)特别有用,因为它确保了所有环境中使用相同版本的依赖。
|
存储 Ubuntu Linux
Windows与Linux的和谐共处时代!🏠
梦想在一台电脑上同时拥有Windows的便捷与Linux的强大开源功能吗?通过虚拟机技术,这已成为现实!虚拟机让你在同一硬件上构建多个独立系统环境,仿佛拥有多台电脑。无需重启,即可无缝切换操作系统,无论是开发、测试还是学习,都能轻松应对。本指南将带领你从下载VMware Workstation开始,一步步创建属于自己的Linux虚拟机,开启多系统并行的新篇章。🚀🏠🌈
277 0
|
设计模式 API Python
Python Web:Django、Flask和FastAPI框架对比
Python Web:Django、Flask和FastAPI框架对比
629 0
|
JSON 缓存 安全
第 87 天:Python Web开发 OAuth2.0 简介
第 87 天:Python Web开发 OAuth2.0 简介
1121 0
第 87 天:Python Web开发 OAuth2.0 简介
|
前端开发 JavaScript
前端框架的选型、分类、常用框架整理(含官网链接)
前端框架的选型、分类、常用框架整理(含官网链接)
860 7
|
消息中间件 存储 监控
写了10000字:全面学习RocketMQ中间件
以上是 V 哥在授课时整理的全部 RocketMQ 的内容,在学习时重点要理解其中的含义,正所谓知其然知其所以然,希望这篇文章可以帮助兄弟们搞清楚RocketMQ的来龙去脉,必竟这是一个非常常用的分布式应用的中间件,好了,今天的内容就分享到这,我靠!已经 00:36分,建议收藏起来,慢慢消化,创作不易,喜欢请点赞转发。
2641 2
|
开发框架 移动开发 网络协议
ASP.NET Core 使用 Web Socket
ASP.NET Core 使用 Web Socket
604 0
|
数据可视化 大数据 开发者
R语言中值得学习的7个可视化,附代码段&案例数据集
随着数据量的不断增加,不使用可视化来描述事例是不可能的。 数据可视化是一种将数字转化为有用知识的艺术。
13276 0

热门文章

最新文章