你知道数字图像处理的经典Lenna图背后的故事吗

简介: 你知道数字图像处理的经典Lenna图背后的故事吗

引言

你一定对这张图片不陌生,或许在教科书上看过,亦或者在网上看过,但你知道图片中的人物是谁吗?为什么这张图会在图像处理领域广为流传?

image.png

介绍

Lenna(或Lena)图片是用于压缩算法的最广泛使用的标准测试图像之一

《IEEE图像处理期刊》的主编 David Munson 认为有两个原因:“首先,这张图片含含有细节部分、平坦区域、阴影和纹理,有利于测试各种不同的图像处理算法。其次,这是一个非常迷人的女性照片,图像处理领域(多数人为男性)愿意使用一张他们认为很有吸引力的图片也并不令人惊奇。” 这张图片含有丰富的频段,包括处于低频的光滑皮肤和处于高频的羽毛,很适合做为测试图片。而人眼对于人脸的细节差别感受也远比一般的景物更为明显。

会议论文

Jamie Hutchinson在IEEE专业通信协会通讯中发表的这篇出色的2001年5月文章原作论文http://www.lenna.org/pcs_mirror/may_june01.pdf

image.png

历史故事

亚历山大·索丘克估计那是在1973年6月或7月,当时他是南加州大学信号与图像处理系的电子工程助理教授。研究所(SIPI)与一名研究生和SIPI实验室的经理一起,在实验室里搜寻一张好照片,以便扫描同事的会议论文。他们已经厌倦了通常的测试图像,这些无聊的东西可以追溯到20世纪60年代初的电视标准工作。他们想要有光泽的东西,以确保良好的输出动态范围,他们想要一张人脸。就在这时,有人碰巧拿着最近一期的《花花公子》走进来。工程师们撕下了插页的前三分之一,这样他们就可以把它包在装有模数转换器(一个每个用于红色、绿色和蓝色通道) 和一台惠普2100小型计算机。Muirhead的固定分辨率为每英寸100行,工程师们想要一张512 ✕512的图像,所以他们将扫描限制在图像的顶部5.12英寸,有效地将它裁剪在受试者的肩膀上。在找到这个棘手、乏味的过程后,有人意识到他们因为软件错误而丢失了一行。此外,模数转换器的时序被关闭,使得输出图像与原始图像相比略有拉长。

时间紧迫,工程师们选择了扭曲的版本,并简单地复制了顶线,以达到所需的512。这三组512条线——每种颜色一组,是一时冲动不完美地创造出来的,除了手头的工作之外,没有其他目的——将成为事实上的行业标准。索丘克回忆道:“访客向我们索要拷贝,我们给了他们,这样他们就可以在同一个测试图像上比较他们的图像处理和压缩算法与我们的。”即使在扫描仪变得更加普及,减少了其他研究人员对SIPI提供的磁带的依赖之后,512线仍然是任何旨在保持图像质量同时降低比特率的过程的常规测试。1972年在芝加哥当模特的瑞典人莉娜·舍布勒姆是《花花公子》当年的十一月小姐。她会回到自己的祖国,结婚,抚养孩子,然后才知道她的插页照片已经变成了终极实验室老鼠。不仅如此:莉娜对工程师来说就像丽塔一样。


到1991年,SIPI将莉娜分发给世界各地的研究人员,并收取一定的费用,她经常出现在图像处理期刊、书籍和会议论文的页面上。(通常她被称为“Lenna”,沿用《花花公子》中出现的瑞典语拼写。)

即使在今天,如果你翻阅一期《光学工程》或相关期刊,你可能会看到不止一个莉娜,有时会看到几十个。根据我对这里图书馆书架的非正式调查,如果标准是Lena的频率,那么IEEE图像处理杂志是目前为止最性感的杂志。粗略地搜索一下网络,就会发现无数网站使用莉娜进行研究演示。最棒的是,你现在可以免费获得你过去必须支付的费用:标准的Lena可以从几个实验室网站下载,而不仅仅是SIPI。

尽管工程师们未受惩罚地培育出新的Lenas,但光学工程事件似乎唤醒了他们对法律的认识。“当然,莉娜提高了我们社区对版权问题的认识,”伊利诺伊大学教授大卫·蒙森说,他在20世纪90年代初编辑了《电气和电子工程师协会杂志》。“现在人们谈论了很多关于版权的话题,尽管不是专门针对莉娜的——尤其是如果一个大项目正在进行,很多人都在使用同一个图像数据库。”

卡耐基梅隆大学计算机科学研究生查克·罗森伯格(Chuck Rosenberg)维护着一个专门介绍莉娜的网页,他解释说,许多研究人员对莉娜的形象非常了解,他们可以很容易地评估任何算法

基于这个原因,这个领域的大多数人似乎都认为莉娜已经很好地充当了一个标准。她就像音乐家的A440,或者地质学家的岩石锤,出现在现场标本旁边的照片中:这是一个熟悉的参考,有助于内部人士做好判断。此外,图像混合了亮与暗、模糊与清晰、细节与平坦的区域,为图像处理算法提供了严格的测试。


批判之声

罗森伯觉得,随着莉娜接近30岁,她已经不再有用了。他列举了自20世纪70年代以来成像技术的进步,这些进步使得比莉娜更好的标准成为可能。其他人的攻击更有活力。1996年5月的一篇文章

在琼·范·塔索的《高级成像》中,引用了数字视频专家查尔斯·波因顿对莉娜的批评。波因顿列举了莉娜出身的不确定性(所用的电影,照明条件,制作过程她去了出版社),并得出结论,她作为标准的地位是“关于图像处理领域的一个可悲的声明。”

1997年组织莉娜出席波士顿会议的行业公关杰夫·塞德曼(Jeff Seideman)已经确定了这部电影和使用的相机。赛德曼是莉娜的热心支持者,他希望看到工程师和他们的协会与《花花公子》档案馆合作,重建其余缺失的信息,以便开发新的、改进的莉娜标准。到目前为止,他的呼吁无人理睬。

或许莉娜作为一个标准最严重的缺点源于她也是一个符号。有趣的是符号对于不同的人来说意味着非常不同的东西。

范·塔索的文章引用了一位女性研究人员的话,她在科学图像处理网络讨论组上发布了以下内容:“图像充满了男性对女性性行为的幻想版本,不需要乳房或臀部就能把女性说成是有限的、定义明确的版本

一个人。"光子学编辑桑尼·班斯赞同这种情绪。她在1997年5月的《电子工程时报》上写道:“当你是一个在男性主导的领域工作的女性时,感到被孤立并不难。"在学术期刊上看到女性的挑逗形象会增加那种不被包容的感觉.“在与出版商协商后,贝恩决定禁止莉娜出版她编辑的出版物。她报告说收到了女性的感谢信,但没有人抱怨这项政策影响了她们的工作。西奥·帕夫利迪斯,当时是纽约州立大学石溪分校的教授,1996年,当PWS出版公司(马萨诸塞州波士顿)出版了他的计算机绘图书时,他受到了这样的禁令,他计划用莉娜来说明色彩半色调。“他们坚持认为任何插图都不能包含可能被认为是冒犯性的图片,比如女性的脸看起来有些不自然,”帕夫利迪斯回忆道。但他并没有因为这项政策而感到气馁:“当你可以用其他东西表达同样的观点时,让人们感到不安是没有意义的。”帕夫利迪斯说,他选择花瓶和鲜花等物品的图片,“只是为了注意安全。”

大卫·蒙森以IEEE图像处理杂志编辑的身份发表了同样的反对意见:“很明显,有些人想让我禁止莉娜进入杂志,”蒙森说。“人们不反对这个形象本身,但反对它来自《花花公子》的事实,他们觉得《花花公子》利用了女性。”曼森没有禁止莉娜,而是写了一篇社论,鼓励作者使用其他图像。


虽然莉娜仍然是该领域最受欢迎的测试形象,但她的优势已经近年来有所下降。没有人能说这种下降有多大比例是由于围绕着莉娜的法律、技术和文化的纠葛,而不是由于现在可获得的其他样品的数量。


献给Lenna的十四行诗

英文原版见链接http://www.nofiles.de/roots/lena/lenapoem2.html


中文翻译版

(在结合数字图像处理的专业名词中饱含了对Lenna的溢美之词)


哦,亲爱的雷娜,你的美丽是如此浩瀚而难以快速描绘


如果我能压缩你的影像,我想我能震动整个世界


唉,当我第一次使用矢量量化,我发现你的面庞只属于你自己


你那千缕丝般的长发,怎能用离散余弦变换来匹配


而你那性感的双唇,即使耗尽十三部超级计算机也找不到合适的分形碎片来形容


虽然这些挫折如此巨大,我也许还能将它们一一克服


但当滤波器夺走了你眼中的光彩,我只能说:“算了,数字化就好。”


原图链接

原图是果照,疑似引起不适,读者慎重

The Complete Lenna Story - High Resolution Version

链接:http://www.lenna.org/full/len_hires.html

The Complete Lenna Story - Unpublished Image

链接:http://www.lenna.org/full/len_unpub.html

标准Lenna测试图 Lenna_std.tif

链接:https://pan.baidu.com/s/1yeSV_DaBwXr_Rp6gMlKF6Q?pwd=2021

提取码:2021


版权之争

多年来,关于使用此图像一直存在相当多的争议。有些人建议禁止使用此图像,因为它的来源。

直到《光学工程》杂志在当年7月份的封面上刊登了莉娜的照片,花花公子才知道有这样的违规行为。有人把封面引起了《花花公子》的注意,莉娜的合法所有者给杂志的出版商国际光学工程学会(SPIE)发了一封尖锐的信,要求授权进一步使用其图像。

编辑布莱恩·j·汤普森在1992年1月的《光学工程》社论中报道说,已经与《花花公子》就莉娜号达成了谅解图片,但他用粗体强调了作者在使用他人财产时获得许可的一般责任。

根据SPIE出版总监埃里克·佩珀的说法,当他给《花花公子》打电话回应这封信时,双方达成了谅解。“当我向他们解释一切时,他们告诉我们,只要使用是为了研究和教育,他们就不会干涉,”并补充说,“当时几乎就好像Lena已经进入了公共领域。差不多,但不完全是。”


结尾

莉娜最后一个意外的细节:她在伍迪·艾伦1973年的电影《沉睡者》中短暂露面。艾伦,扮演在200年的低温诱导睡眠后于2173年醒来的英雄,被要求鉴定一些20世纪的文物。其中一件文物是《花花公子》的插页其中一张照片中,莉娜戴着柔软的羽毛帽子,站在一面全身镜前,回头凝视着观众

她裸露的右肩,眼睛在招手,嘴角挂着蒙娜丽莎式的微笑。自《蒙娜丽莎》以来,没有哪幅图像被研究得如此深入。


另一个有趣的琐事是,Lenna的一期(1972年11月)是《花花公子》有史以来最畅销的一期,售出了7,161,561份。


卡耐基梅隆大学计算机科学研究生查克·罗森伯格(Chuck Rosenberg)维护着一个专门介绍莉娜的网页关于Lenna的介绍网页http://www.lenna.org/


参考文献

http://www.lenna.org/

http://www.lenna.org/pcs_mirror/may_june01.pdf


相关文章
|
3月前
|
机器学习/深度学习 算法 Python
**《惊世发现!揭开机器学习 k-近邻算法测试的神秘面纱,震撼你的认知边界!》**
【8月更文挑战第16天】k-近邻算法(kNN)是机器学习中一种直观且有效的分类与回归方法。它基于距离度量,对新样本找到训练集中最近的k个邻居并根据多数表决预测类别。通过示例展示了如何使用Python和`sklearn`库实现kNN,并采用交叉验证优化k值以提高模型的稳定性和准确性。充分测试kNN有助于在实际问题中发挥其最大效能。
33 1
|
3月前
|
人工智能 JSON 自然语言处理
🔍深度揭秘!如何用提示词驾驭生成式大模型,让你的创意无限飞🌈
【8月更文挑战第1天】在AI风潮中,生成式大模型因出色的内容创造能力备受创意工作者青睐。但如何巧妙运用提示词,激发模型潜力,仍是挑战。本文通过问答形式揭秘提示词技巧:理解其定义、掌握设计方法(明确目标、具象描述、考虑模型特性)、评估其影响力及调整策略(细化描述、变换风格、调节参数),并分享实用贴士,助您成为驾驭AI创作的高手。
178 7
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
深度之眼(二十六)——神经网络基础知识(一)
深度之眼(二十六)——神经网络基础知识(一)
|
4月前
|
机器学习/深度学习 算法 数据挖掘
深度之眼(二十七)——神经网络基础知识(二)
深度之眼(二十七)——神经网络基础知识(二)
|
Cloud Native Go 开发工具
如何让CSDN学习成就个人能力六边形全是100分:解析个人能力雷达图的窍门
如何让CSDN学习成就个人能力六边形全是100分:解析个人能力雷达图的窍门
298 0
|
6月前
|
机器学习/深度学习 人工智能 编解码
干货 | 超形象理解扩散模型相关知识点
干货 | 超形象理解扩散模型相关知识点
53 0
|
6月前
|
算法 数据可视化 vr&ar
【图形学】探秘图形学奥秘:图形变换的解密与实战
【图形学】探秘图形学奥秘:图形变换的解密与实战
87 0
|
6月前
|
机器学习/深度学习 人工智能 vr&ar
从概念到现实:ChatGPT 和 Midjourney 的设计之旅
从概念到现实:ChatGPT 和 Midjourney 的设计之旅
173 0
|
6月前
|
Serverless 容器
1 张图概括你的 2023 年丨AIGC 创意画作
1 张图概括你的 2023 年丨AIGC 创意画作
|
机器学习/深度学习 人工智能 自动驾驶
强化学习从基础到进阶--案例与实践含面试必知必答[10]:模仿学习、行为克隆、逆强化学习、第三人称视角模仿学习、序列生成和聊天机器人
强化学习从基础到进阶--案例与实践含面试必知必答[10]:模仿学习、行为克隆、逆强化学习、第三人称视角模仿学习、序列生成和聊天机器人
强化学习从基础到进阶--案例与实践含面试必知必答[10]:模仿学习、行为克隆、逆强化学习、第三人称视角模仿学习、序列生成和聊天机器人