MIT黑科技:“不开卷也有益”,计算机不翻书就能读完一本书

简介:

编者按:第一眼看到文章的标题,大家肯定会不约而同地想到:“Isn’t it amzing that computers can read through a book page by page without opening it”?讲真,我们文章的作者,来自MIT Media Lab的A. R. Sanchez, B. Heshmat, A. Aghasi等研究员们,将为大家详细讲述如何运用太赫兹时栅光谱成像技术从层状结构中,如一本闭合着的富有文化价值的古籍,提取文本内容不同于X射线或超声波,该成像技术能够区分页与页之间、空白页与有文字的页之间的差异,透读9页纸张上的内容。目前,研究员们正在继续努力,以期实现技术上的突破,提升该项技术在工业、文化遗产研究等领域的实际应用。

 在传统意义上,飞行时间成像技术一般应用于快速成像(飞秒摄影Femto photography)和复杂的几何图形成像(如在拐角处或漫射器内成像)。由于光速将时间与空间紧密联系在一起,时间分辨率越高,空间分辨率也将随之增加。在我们的最新研究中,我们将从100千兆赫兹到3太赫兹范围内甄选出一个能够穿透纸张或其他材料的频段。我们也将对具有很高时间分辨率(每秒10兆帧)的光脉冲进行取样,取样所得的光脉冲是我们之前的研究中所用光脉冲的20多倍。如此高的时间分辨率将空间分辨率提升到30微米左右,使将一本合着的书的页与页之间分开来成为可能。我们提出了一种扩展算法使这种成像方式(可以称之为太赫兹时间域光谱技术)既能够成像,也能够透读密集的层状结构。这种成像技术当然在工业检测中能够得到应用,不过,也能够用于透读闭合着的古老文件或者检查富有文化价值的书籍样本。

对一些复杂样本,如闭合的书籍,进行非侵入性检查当前所面临的三大成像技术瓶颈为:空间分辨率,光谱对比度和遮挡。我们运用传统太赫兹时间域光谱学技术的飞行时间能力,并结合其光谱能力,力图在算法上克服这些技术瓶颈。据我们的研究报道,能够成功地无监督式提取一个类似于一本闭合的书籍的密集层状结构所包含的内容。

基于反射所得的太赫兹电场的统计结果,我们的技术使用类似飞行时间的测量方法来定位书中的每一页。层定位结束后,我们运用一种新型时栅光谱分析方法,这种分析方法能够调整每一页的频率,使之对应光谱域中对比度最高的帧。随着页码的增加,我们采用的研究方法能够产生一种等级凸显效果,为每一页排序。当使用一种最近才提出的能够识别出每一页被遮挡的字母的方法后,整个成像过程便宣告结束。实验结果表明,我们已经能够成功地从一扎至少9页带有文字的纸张中提取出字母。

由于工业界有不计其数的层状结构,每层的厚度大约有亚毫米,和数不清的富有文化价值的文本(如文件,书籍和艺术作品),运用THz TDS(太赫兹时间域光谱技术)从层状结构中提取内容具有广阔的应用前景。因此,我们的研究将有助于改进THz和其他用于从层状结构中提取内容的时间分辨率成像技术。

我们的研究证实了太赫兹时栅成像技术在提取深度内容方面的实际应用,并且为成像与传感领域的研究指明了新的研究方向。我们的研究结果报告如下:

MIT黑科技:不开卷也有益,计算机不翻书就能读完一本书

1. 与传统的去卷积技术相比,THz TDS的电场统计结果能够提高较深层层定位的精确度。此外,这种技术在提取脉冲方面的应用并不依赖一种参考测量标准。

2. 太赫兹时间域光谱技术具备的飞行时间能力或时间分辨率主要能够用于在空间内分辨3D光谱特征(而并非用于对整个样本作纯粹的变换谐波量分析)。这将有助于我们调整文本内部和空白页之间微小的光谱差异,以达到凸显文本的目的。

3. 目前提出的计算方法,如基本凸形状分解,能够通过精确恢复被遮挡的内容,从而得到全新的应用。

MIT黑科技:不开卷也有益,计算机不翻书就能读完一本书

此外,我们的技术对以下三个领域产生了重大影响——超快成像,计算成像和太赫兹光谱成像。我们期望,我们的研究结果将激发广大读者对于太赫兹时栅成像技术的浓厚兴趣,同时为其检查层状结构和层状结构成像搭建一个新的平台。本研究将对工业成像、地震成像领域的研究和文化遗产研究产生深远的影响。此外,由于这种成像方式是以映像的形式为依托的,它的应用将拓展到运用其他类型飞行时间传感器的远距离成像研究中。

读者可能对与本文相关的一些问题感兴趣,我们在这里简要提及四个:

1. 我们的研究与camera future的“每秒兆帧成像”研究项目有什么联系?

我们运用相似的超快成像方法定位每一页。基于测量所得的太赫兹脉冲达到的时间,我们计算出每一页的位置,然后观察脉冲的光谱,以确定该页的某个位置是否有墨迹。Camera future 的“每秒兆帧成像”项目是首个将物理学中常用的超快设置方法运用到成像系统与应用的项目。

2. 难道X射线或超声波不能实现从层状结构中快速提取内容吗?

似乎,X射线或超声波也能够实现读通书本,成像;但是,与我们的THz技术相比,这类技术在亚微型钢笔墨水或铅笔层与空白页之间不能形成对比对。这类方法也有其他的缺点,如花费高和电离辐射。如果运用CT的话,将很难检测出一本闭合的书籍中页与页之间的差异,因而不能看到文本内容。然而,我们的远红外时间分辨系统是基于纸张吸收光谱的,这种成像技术将成为唯一一种用于逐张提取文本内容的技术。

3.  该THz TDS成像技术的创新之处体现在哪里?

该技术的核心贡献在于:

      1、运用THz信号统计结果提取一层文本内容。与传统的方法相比较,这种新技术能够运用于更多也输得内容提取。

      2、运用Kurtosis的光谱对比度来调整空白纸与有墨迹的纸张频率域之间的细微差异。

      3、凸基本形状匹配,能够检测出被遮挡的字母。

      4、我们应用上述提到的所有技术,以便采用计算方法并利用THz时间域光谱系统的光谱分辨率与时间分辨率实现新的应用。

4. 该技术的局限性体现在哪里?

SNR与光谱对比是当前的主要技术瓶颈;一个具备更高性能的系统将有助于我们“更深地”读书。另一局限性在于薄纸张的变形,纸张变形将导致信号的扭曲,近来我们的研究有志于解决这一难题。

原文链接

via A. R. Sanchez et al.

本文由雷锋网(公众号:雷锋网)独家编译,未经允许拒绝转载!


本文作者:高婓


本文转自雷锋网禁止二次转载,原文链接

相关文章
|
11月前
|
人工智能 人机交互
田渊栋等原班人马又一新作:AI生成长篇故事,数千字长文也能连贯、有趣
田渊栋等原班人马又一新作:AI生成长篇故事,数千字长文也能连贯、有趣
|
存储 机器学习/深度学习 人工智能
一文总结那些年我们追过的计算机发展史
一文总结那些年我们追过的计算机发展史
186 0
一文总结那些年我们追过的计算机发展史
|
SQL 算法 前端开发
撕书吧!编程小白!你也能学的哈佛CS50,全美最受欢迎计算机入门课
【新智元导读】自学计算机,到底如何入门?哈佛大学计算机导论课程 CS50推荐给编程小白们,这门课是哈佛最受欢迎的课程之一,老师风趣幽默,带你少走弯路,直奔编程大门。
368 0
撕书吧!编程小白!你也能学的哈佛CS50,全美最受欢迎计算机入门课
|
大数据 云计算
计算机小白与阿里云的爱恨情仇
应届毕业生一路打怪升级学习阿里云的故事
DayDayUp:《机器崛起前传》第二十二章【蹒跚而来】读后感(文章源自网络)—听课笔记
DayDayUp:《机器崛起前传》第二十二章【蹒跚而来】读后感(文章源自网络)—听课笔记
|
算法 Java C++
漫漫大学江湖录 - 爱与恨唯与工作更交织
前言 其实在18年11月有了华为,就已经宣告结束了大学校招历程,是时候写下总结了,再不写估计很多东西都忘了。 在一些程序员社区混久了,从别人的学习、求职、工作经历中越发感受到很多的正能量,也本着攒RP值的原则,向学弟学妹们,尤其和我非名校双非本科生学弟学妹们传递点正能量,因为博主也是非名校出身,而且在整个求职的过程中能够很明显地感受到名校学生那种得天独厚的优势,同样的实力,名校学生进入BAT等一线互联网企业确实要容易很多,即便技术很水,一样有华为等企业保底,而非名校的可能连简历筛选这关都过不了。
2504 0
|
人工智能 算法 区块链
【书评】《区块链、人工智能、数字货币》:一本可以搞清楚身边黑科技的指导手册
区块链、人工智能还有数字货币,科技的创新正在重新定义着我们的生活。这些黑科技是怎么来的?它们如何运作?它们有什么样的价值?给我们什么样的选择?
1138 0
|
机器学习/深度学习 人工智能 自然语言处理