想骗过人脸识别?一块钱就够了(附送几组骗AI的方法+论文)

简介:
本文来自AI新媒体量子位(QbitAI)

0?wx_fmt=gif&wxfrom=5&wx_lazy=1


人脸识别越来越常见,今年春运已经能刷脸进站,iPhone的相册就能用人脸分类照片,社交网站上能根据人脸标记照片。然而如同央视315提醒的那样,这项技术距离无懈可击还有一段距离。

比如说,一副成本1块钱的眼镜,就能骗过人脸识别的AI。

一个能够愚弄人脸识别AI的眼镜

来自卡内基梅隆大学(CMU)的研究人员表示,佩戴专门设计过的眼镜架,可以愚弄最先进的面部识别软件。一副眼镜,不单可以让佩戴者消失在人工智能识别系统之中,而且还能让AI把佩戴者误以为是别人。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

一副眼镜能有如此奇效,正是利用了机器理解人脸的漏洞。面部识别软件通常基于深度学习系统,通过大量的数据训练来寻找模式。

与人类对人脸的理解相比,机器对人脸的识别发生在抽象层面。电脑不是用人类的方式认脸,只是在像素中寻找模式。如果你知道这些机器在寻找哪种模式,就能轻易的愚弄这些人工智能系统,这正是CMU研究员们所做的事情。

首先,他们找到了与特定面孔相关的图案,然后把这些图案打印到一副宽边眼镜上。然后在测试中,机器对戴上眼镜的研究人员“视若无睹”。不仅如此,眼镜还能用来冒充别人。

一位41岁的白人男性研究员,仅凭一副眼镜,就能冒充女演员……准确率87.87%。

当然这个研究也有明显的局限。比如不同的距离、不同的照明条件下,效果会有差异。最重要的是,实验室的测试并不代表在现实中总是可行。

不过无论如何,如果你想保护隐私,戴这种眼镜,总比画上一个CV Dazzle妆要省事儿。什么是CV Dazzle?贴几张图给大家看看……

640?wx_fmt=png&wxfrom=5&wx_lazy=1

640?wx_fmt=png&wxfrom=5&wx_lazy=1

机器会认错的,不只是人脸

显然,在认人这件事上,有很多种方法可以骗过机器。那么,机器在识别其他物体的时候,还会被骗吗?

也会。比如说:

640?wx_fmt=png&wxfrom=5&wx_lazy=1

这是什么?

作为人类,我们只看到不同颜色相间的波纹。

但是来自Google、Facebook、Mobileye的图片软件们不约而同地说:这是海星啊!

“这种感觉就像各家神经网络坐在一起吐槽:长得多标准的一个海星啊,这些愚蠢的人类怎么就看不出来呢?”论文《Deep Neural Networks are Easily Fooled》的作者之一、怀俄明大学的助理教授Jeff Clune说。

这篇论文发表在2015年的计算机视觉顶级学术会议CVPR上,还获得了Community Top Paper奖。

Clune在论文中提到,很多在人类看来毫无意义的图片,输入到神经网络中,会被分类为某种物体。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

比如说,上图左侧的8张图片,在人类看来都是电视机雪花屏的图案,但是在神经网络看来,这里面包含了燕雀、犰狳、小熊猫、猎豹甚至菠萝蜜……

你说是熊猫?机器说是长臂猿

人类看起来毫无异样的图片,到了机器那里也可能会被错认。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

比如说在人类眼中,上图左右两边都是熊猫;但计算机就会认为,左边的(可能)是熊猫,而右边的是长臂猿。

这张图片,来自Ian Goodfellow发表在ICLR 2015的论文Explaining and Harnessing Adversarial Examples。

其实早在2013年和2014年,科研人员们就在讨论这类问题。Goodfellow在2014年曾经发表了一篇关于反例攻击(Adversarial Examples)的论文。去年10月一篇题为《Universal Adversarial Perturbations》则提出了一种通用的“扰动”方式,可以导致各种神经网络将图片误分类。

Goodfellow在Open AI工作期间,还发文介绍在反例攻击和防御策略,量子位曾经进行了编译。

AI的判定边界

现在,人类的科学家还没有完全搞清楚,这些骗过机器的方式为什么会有效,在什么情况下会失败。

一种常见的解释是,它们利用了AI系统中的“判定边界”。

所谓“判定边界”,是指机器区分两类物体所用的一组隐形的规则。比如说我们设计了一个非常简单的分类器,用来区分狮子和猎豹,经过一段时间的训练之后,机器会创造出一个X-Y平面,右上方是猎豹、左下方是狮子,而狮子和猎豹之间的分界线,就是“判定边界”。

Clune认为,会出现上面这些“骗过图像识别系统”的方法,是因为判定边界过于武断。“你对神经网络所做的,就是训练他们在数据的集群之间划定界限,而不是对什么是猎豹、什么是狮子进行深入的建模。”Clune说,他认为解决这个问题,需要让图像分类器能够得出“我不知道这张图片是什么”的结果,而不是强行将它归为某一类。

我知道你们想看论文

我们整理了文章中提到的论文,在量子位公众号(QbitAI)对话界面回复“反例攻击”查看。

本文作者:舒石 李林
原文发布时间:2017-04-13
相关文章
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
扩散引导语言建模(DGLM):一种可控且高效的AI对齐方法
DGLM(Diffusion Guided Language Modeling)是一种新型框架,结合了自回归模型的流畅性和扩散模型的灵活性,解决了现有引导生成方法的局限性。DGLM通过扩散网络生成语义提案,并使用轻量级提示生成器将嵌入转化为软提示,引导自回归解码器生成文本。该方法无需微调模型权重,易于控制新属性,并在多个基准数据集上表现出色。实验结果显示,DGLM在毒性缓解、情感控制和组合控制等方面优于现有方法,为可控文本生成提供了新的方向。
18 10
扩散引导语言建模(DGLM):一种可控且高效的AI对齐方法
|
27天前
|
机器学习/深度学习 存储 人工智能
AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
【9月更文挑战第1天】AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
|
28天前
|
人工智能 开发者
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
【9月更文挑战第8天】《自然》杂志近日揭露,学术出版商如泰勒·弗朗西斯与微软签订千万美元合约,及威利获高额报酬,将论文提供给科技巨头训练AI模型,引发学界对版权与收益分配的热议。此现象反映了AI对高质量数据的渴求,但亦使研究人员担忧成果被无偿商用,且可能影响学术独立性。尽管AI训练使用学术资源能提升模型科学性,助力科研进展,但如何保障作者权益及维持学术纯粹性仍是亟待解决的问题。https://www.nature.com/articles/d41586-024-02599-9
33 4
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
探索软件测试的未来:AI 驱动的自动化测试方法
【5月更文挑战第29天】随着人工智能(AI)技术的不断发展和成熟,其在软件测试领域的应用也日益广泛。本文旨在探讨 AI 如何改变软件测试的面貌,特别是自动化测试方法。我们将分析当前自动化测试的挑战,并介绍 AI 如何提供解决方案,包括智能化测试用例生成、测试执行优化、以及结果分析等。通过实际案例研究,我们还将讨论 AI 在提高测试效率、减少错误和提升软件质量保障中的作用。最后,文章将预测 AI 在自动化测试领域的未来趋势,并提出对测试工程师的建议。
|
2月前
|
人工智能 数据挖掘 语音技术
通义语音AI技术问题之JPCP方法的工作原理如何解决
通义语音AI技术问题之JPCP方法的工作原理如何解决
27 5
|
2月前
|
人工智能
通义语音AI技术问题之Diagonal Attention Pooling(Ditto)方法的工作原理如何解决
通义语音AI技术问题之Diagonal Attention Pooling(Ditto)方法的工作原理如何解决
43 4
|
2月前
|
数据采集 存储 人工智能
利用AI技术改善数字化转型项目的九种方法
利用AI技术改善数字化转型项目的九种方法
|
2月前
|
机器学习/深度学习 人工智能 算法
在 AI Native 环境中实现自动超参数优化的微调方法
【8月更文第1天】随着人工智能技术的不断发展,深度学习模型的训练变得越来越复杂。为了达到最佳性能,需要对模型进行微调,特别是对超参数的选择。本文将探讨如何在 AI Native 环境下使用自动化工具和技术来优化模型的微调过程。
60 5
|
2月前
|
人工智能 自然语言处理 数据挖掘
通义语音AI技术问题之一体化时间戳预测方法对于挑战如何解决
通义语音AI技术问题之一体化时间戳预测方法对于挑战如何解决
19 0
|
3月前
|
人工智能 数据挖掘
客户在哪儿AI分享全方位锁定客户“追着打”的有效方法
ToB销售攻占大客户需综合能力,包括个人能力、关系、团队实力、创新和学习。客户在哪儿AI提供企业全历史行为数据分析,助销售理解客户全貌,制定全场景策略,洞察偏好,从而更精准地接触和服务大客户。借助这种数据驱动的方法,销售能创造更多自然接触点,提升成功几率。

热门文章

最新文章

下一篇
无影云桌面