详解苹果Face ID,将让深度摄像头成主流

简介:

iPhone X的信息想必都知道了,它正面几乎全是屏幕,也就意味着唯一的按键Home键以及Touch ID的消失,而新的身份认证方式就是Face ID。如其名,在开锁时用户只需要看着手机,Face ID就能实现刷脸解锁。

随着人工智能概念的普及,人脸识别已经屡见不鲜。但这次,苹果除了用到图像识别外,还在Face ID的人脸识别中加入了深度信息,让身份认证更安全。

Face ID的实现靠的是iPhone X顶部一小块没被屏幕覆盖的区域。这一小块区域集成了多达八个组件,除了麦克风、扬声器、前置摄像头、环境光传感器、距离感应器等我们熟知的部分,还集成了红外镜头、泛光感应元件(Flood illuminator)、点阵投影器。

详解苹果Face ID,将让深度摄像头成主流

苹果将整个系统称之为原深感摄像头(TrueDepth Camera System),而整个系统除了能用于Face ID人脸验证,也可以扩展自拍功能,实现动画表情发布,和AR效果叠加。

详解苹果Face ID,将让深度摄像头成主流

具体而言,上述的感应器会投射人眼看不见的光,并读取用户的脸部3D几何结构图,并将它与存储在A11芯片隔区内的数据进行对比,如果两者一致,iPhone X就会解锁。在注册时,点阵投影仪会投射3万多个点在人脸上,从而形成一张3D人脸图,并存储在A11芯片上。使用中,泛光感应元件会打一道看不见的光在人的脸上,这样在黑暗中也能识别人脸。

苹果甚至为此开发了一个神经引擎(Neural Engine),可即时处理人脸识别。苹果高级副总裁Phil Schiller在发布会上解释称,“我们用神经网络处理图像和点阵模式,来建立人脸数学模型。”

苹果还请好莱坞特效面具公司制作了一组面具,来训练神经网络,保证安全性。虽然下图看起来还挺可怕。

详解苹果Face ID,将让深度摄像头成主流

库克在发布会上说,Face ID比Touch ID更为安全,后者被破解的概率是五万分之一,而前者是百万分之一。无论是改变发型,戴上眼镜,还是戴上帽子,Face ID都能成功识别。不过苹果也提到,Face ID在长相近似的人身上可能会失效,如果是双胞胎的话,出错的概率会增加不少。

另外,Face ID还是要在用户将注意放在手机上时才能使用,也就是说解锁时要睁眼看着手机,否则就失效了。

Face ID同时支持Apple Pay和第三方应用,实现刷脸支付。

人脸识别与刷脸支付早已被外界熟知,雷锋网也曾报道过马云在支付宝上的演示。这次苹果的Face ID在二维的图像上叠加了一层深度信息,可以保证人脸识别更安全。对于人脸识别中用照片蒙骗系统的问题,由于有了3D信息,也起不到作用。

而且正如苹果演示的那样,多出来的深度信息还可以优化前置相机拍摄效果,实现动画表情,叠加AR特效等功能。

详解苹果Face ID,将让深度摄像头成主流

若要追溯苹果对深度摄像头念头,不严格的说可以回到2013年。雷锋网曾报道,当年底苹果以3亿美元左右的价格收购了以色列公司PrimeSense。

PrimeSense可以说是当时最强的3D传感技术公司,它主要提供传感器和中间件,可以让设备感知周边的三维环境,实现人机交互。这家公司号称拥有全球最小的3D感知芯片,能用在手机、电视、平板、机器人等各类设备上。

它与微软合作开发了第一代体感设备Kinect。当时,微软想以体感体验与任天堂的Wii和索尼的PS争夺家庭主机市场。后来微软有意收购Primesense,但由于价格没谈拢而作罢,而且双方的合作也终止,这导致后者内部经历了大裁员。

在失去最大的客户后,Primesense估值下滑,最终被苹果收购。并购后,外界一直在猜测,苹果会何时用上深度感知技术。如今它终于将其用在了手机前置摄像头上。

目前深度感知领域有三大主流技术方案:飞行时间(TOF),结构光,双目视觉。PrimeSense用的是结构光方案,毫无疑问,苹果也用的改良版的方案。

如前所述,用结构光方案获取深度信息,原理简单来说,就是向空间投影一定图案,传感器获取反射回来的图案,与原图进行对比就能生成深度图。英特尔的RealSense实感技术也用到了这种方法。

TOF深度摄像头后来被微软用在了第二代的Kinct,其原理是,传感器发出经调制的脉冲红外光,遇物体后反射,传感器通过计算光线发射和反射时间差或相位差,来换算被拍摄景物的距离,以产生深度信息,此外再结合传统的相机拍摄,就能将物体的三维轮廓以不同颜色代表不同距离的地形图方式呈现出来。

双目视觉比较好理解,就是模仿人眼的结构,通过两个摄像头的视差来确定距离信息。这种方案在移动设备上的应用较少,多用在户外机器人。

国内做深度摄像头的厂商奥比中光告诉雷锋网(公众号:雷锋网),比较三种方案,飞行时间测量的精准度和稳定性较好,但结构光可以做得更小、功耗小、测量分辨率也相对高,双目则属于被动光,无法适应暗光环境。

手机后置摄像头已经从单镜头进化到了双镜头,在这次发布会前,不少业界人士就猜测,新iPhone的前置摄像头也会增加深度信息,由二维进化到三维。现在消息已经坐实,以苹果的体量无疑会引爆市场,让其它厂商纷纷跟进。只是,做指纹识别的公司,你们还好吗。



本文作者:张驰
本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
3月前
|
人工智能 自然语言处理 云计算
iOS迎来AI升级:揭秘Apple全新“智能”系统
iOS迎来AI升级:揭秘Apple全新“智能”系统
iOS迎来AI升级:揭秘Apple全新“智能”系统
|
3月前
|
机器学习/深度学习 人工智能 安全
同等参数中最强,在苹果15Pro上也能运行!谷歌又“卷”出了端侧小模型 Gemma 2 2B...
在AI技术快速演进的背景下,谷歌推出的Gemma 2 2B模型以其小巧体积和卓越性能引起关注。这款仅20亿参数的轻量级语言模型通过知识蒸馏技术,展现出超越大型模型的能力,在Chatbot Arena测试中获得1130分,超过了GPT-3.5-Turbo等竞争对手。Gemma 2 2B不仅性能出众,还能在多种硬件上高效运行,特别适合本地设备。此外,它的开源特性及易于使用的特性降低了AI应用门槛。伴随Gemma 2 2B发布的还有ShieldGemma和Gemma Scope,前者用于过滤有害内容,后者则提高了模型的透明度和可解释性,共同推动AI技术的负责任发展。
114 2
|
4月前
|
Windows
谷歌、Anthropic推出创新神经压缩Equal-Info Windows
【7月更文挑战第16天】谷歌和Anthropic推出Equal-Info Windows,一种创新的神经压缩技术,旨在提升大型语言模型的训练效率。该技术通过均衡每个文本块的压缩比特长度,解决了高压缩率与模型学习透明性之间的矛盾。实验显示,使用该技术的模型在困惑度和推理速度上有所改善,但可能增加额外的计算开销和复杂性。尽管存在局限,Equal-Info Windows为神经压缩研究开辟了新路径,有望优化长文本处理和资源效率。[论文链接](https://arxiv.org/abs/2404.03626)
26 3
|
5月前
|
人工智能 搜索推荐 机器人
随着AI控制你的智能手机,App时代的结束可能已经指日可待
随着AI控制你的智能手机,App时代的结束可能已经指日可待
|
6月前
|
UED
首批类Sora竞争对手出现,Snap Video效果优于Pika、不输Gen-2
【2月更文挑战第13天】首批类Sora竞争对手出现,Snap Video效果优于Pika、不输Gen-2
95 3
首批类Sora竞争对手出现,Snap Video效果优于Pika、不输Gen-2
|
安全
国行 Xbox Series X 深度体验 #122
国行 Xbox Series X 深度体验 #122
268 0
|
人工智能 IDE Java
01----嵌入式AI鸿蒙系统智能相机操作之优秀
01----嵌入式AI鸿蒙系统智能相机操作之优秀
378 1
01----嵌入式AI鸿蒙系统智能相机操作之优秀
|
存储 传感器 编解码
微软行星云计算planet platform中的高分辨率影像通过API接入Google Earth Engine(GEE)
微软行星云计算planet platform中的高分辨率影像通过API接入Google Earth Engine(GEE)
418 0
微软行星云计算planet platform中的高分辨率影像通过API接入Google Earth Engine(GEE)
|
编解码 vr&ar 数据安全/隐私保护
苹果 Face ID 开放《iPhone X ARKit Face Tracking》
本文章来自 腾讯Bugly 《iPhone X ARKit Face Tracking》 iPhone X前置深度摄像头带来了Animoji和face ID,同时也将3D Face Tracking的接口开放给了开发者。有幸去Cupertino苹果总部参加了iPhone X的封闭开发,本文主要分享一下iPhone X上使用ARKit进行人脸追踪及3D建模的相关内容。
605 0
苹果 Face ID 开放《iPhone X ARKit Face Tracking》
|
机器学习/深度学习 数据可视化
更高清!谷歌推出生成文本到图像的新框架 TReCS,效果超过AttGAN
谷歌研究人员推出新框架 TRECS,生成的图像更逼真,更符合文字的描述。
157 0
更高清!谷歌推出生成文本到图像的新框架 TReCS,效果超过AttGAN