深度 | 巨头都在追逐的眼球追踪技术,究竟能带来什么?

简介:

眼球追踪就是这样一个让机器人更懂人类的技术。

深度 | 巨头都在追逐的眼球追踪技术,究竟能带来什么?

人的身体有视觉、听觉、嗅觉味觉、触觉和运动五大感知系统,然而我们所接收的80%的信息都来自于眼睛。

眼睛不仅是我们的输入主设备,也是我们的输出设备。俗话说:“眼睛是心灵的窗户”,情侣之间的爱意也是靠眼波的流连婉转。眼睛透露出我们很多的“秘密”。

目前我们的人机交互还主要靠的是键盘、鼠标、触摸,这些输入并不直接也不高效。人机互动的发展方向应该是越来越人性化,要能“听”、能“看”,能主动探索和回应需求。

眼球追踪让机器更懂你

眼球追踪就是这样一个让机器人更懂人类的技术。

眼球追踪主要是研究眼球运动信息的获取、建模和模拟。一是根据眼球和眼球周边的特征变化进行跟踪,二是根据虹膜角度变化进行跟踪,三是主动投射红外线等光束到虹膜来提取特征。

眼球追踪技术的发展由来已久,应用的场景广泛。

在心理学实验中,可以通过人的瞳孔变化来监测一个人是否在说谎;在广告效果监测方面可以通过人眼注视点的移动来判断人的偏好;而到了人机交互方面,眼睛可以取代键盘、鼠标和触屏,一些手机可以在人眼离开时暂停视频播放,也有残障人士通过眼睛打字完成了一本书的写作。

早在2012年,眼控技术研究科技公司Tobii宣布研发出了适配Windows 8的眼控Gaze界面。这是一家做眼球追踪技术较早的瑞典公司。2007年公司估值1400万美元,2009年则达到了2680万美元。2012年,英特尔注资2100万美元进Tobii公司,也是出于对windows 8操作系统一次投资。2014年,Tobii 推出了第二代智能眼镜 Glass 2,利用每个镜片配备 2 个摄像头以及相应的软件技术,实现对眼球动作的精准捕捉。

深度 | 巨头都在追逐的眼球追踪技术,究竟能带来什么?

图  | Tobii 智能眼镜

英特尔虽然很早就收购了眼球追踪的公司,但是经过多年,眼球追踪依然未成为笔记本电脑的核心交互方式。而VR的发展却让我们看到了眼球追踪技术应用的更多的可能性。

各大巨头争抢眼球追踪公司 布局VR/AR

目前眼球追踪市场中的主要厂商包括Tobii AB(瑞典)、SensoMotoric Instruments GmbH(德国)、Seeing Machines(澳大利亚)、EyeTracking(美国)、Smart Eye AB(瑞典)、EyeTech Digital Systems(美国)和七鑫易维(中国)等。这些厂商有独立开发产品的,也有和大厂合作研发的。

(1)三星投资FOVE:主打眼球追踪的VR头盔

早在2014年末,FOVE就宣布将会发布一款使用眼球追踪技术的头戴显示设备。在当时,Gear VR发布不久,而Oculus Rift和HTC Vive这些PC VR还没发布。

FOVE头显结合了眼球和头部位置追踪,定位传感等技术,让用户可以用眼睛控制显示器。FOVE一开始在Kickstarter上发起众筹,募集到246566美元。而在2015年,三星风险投资公司投资了FOVE,具体投资金额不详。 2016年之时,这家公司A轮融资拿到了1100万美金,并且公布在11月接受预定,售价599美元,价格堪比Oculus。

深度 | 巨头都在追逐的眼球追踪技术,究竟能带来什么?

图 | Fove头显

除了投资FOVE以外,三星自己也在研发眼球追踪的头盔。就在今年7月,一家专注于VR设备眼球追踪的韩国公司Visual Camp称他们正参与研发的一款三星秘密开发的VR一体机——Samsung Exynos VR III。拥有作为领军移动VR头盔Gear VR的三星,其融入了手势识别、眼球追踪的一体机会表现如何呢?

深度 | 巨头都在追逐的眼球追踪技术,究竟能带来什么?

图 | Samsung Exynos VR III 一体机原型

(2)Google收购Eyefluence,或为AR交互

2016年10月,Google收购了一家专注眼球追踪的初创公司Eyefluence。Eyefluence拥有的AR交互专利将提升高清注视追踪技术,并可通过眼睛进行身份识别和密码保护,也就是说,电脑或手机上的指纹扫描和密码输入将由眼球追踪代替。

深度 | 巨头都在追逐的眼球追踪技术,究竟能带来什么?

增强现实眼镜的交互与笔记本电脑和台式电脑的交互方式发生了显著的变化。当增强现实眼镜把图像呈现在人眼之上时,任何需要触摸的交互都难以实现。依靠眼球追踪的交互方式成为显要的需求。

除了Google Glass以外,谷歌已经与HTC、联想合作计划推出VR一体机,或将具有眼球追踪功能。

(3)Facebook收购The Eye Tribe

2017年1月,Facebook旗下公司Oculus确认收购一家专做眼球追踪的创业公司The Eye Tribe,并且将使用其技术来改善Oculus VR产品。

The Eye Tribe成立于2007年,是一个有16人的创业团队,致力于为多平台提供眼球追踪的软件和硬件。他们已经推出了面向计算机设备的眼球追踪开发者套件,售价99美元,一个面向消费者的眼球追踪盒子,售价199美元。这个眼球追踪盒子可以连接到电脑、平板、手机等多种设备。

深度 | 巨头都在追逐的眼球追踪技术,究竟能带来什么?

图 | The Eye Tribe眼球追踪盒子

(4)苹果收购SMI

2017年6月苹果公司昨天确认收购德国计算机视觉公司SensoMotoric Instruments (SMI)。

这家公司的眼球追踪技术解决了VR常见的短板,它能够以120Hz的采样率实时记录用户的自然凝视行为,可以分析佩戴者的目光,并帮助减少眩晕。

深度 | 巨头都在追逐的眼球追踪技术,究竟能带来什么?

在2016年CES上,SMI与Lumus合作推出了一款 带有眼球追踪技术的Lumus DK-50增强现实眼镜。用户能看到AR显示屏幕上的3D图像,并且可以与之互动。

深度 | 巨头都在追逐的眼球追踪技术,究竟能带来什么?

图 | Lumus DK-50

在今年的WWDC(全球开发者大会)苹果公司推出了ARKit,iPhone全面支持AR,一跃成为最大的AR平台。在7月,隐匿三年的Google Glass以企业版的形式宣布回归,但是目前未有消息其应用了眼球追踪技术。苹果将如何整合AR与眼球追踪十分值得关注。

(5)高通、英伟达合作七鑫易维,专注VR底层优化

七鑫易维是国内一家专注眼球追踪技术的公司,成立于2009年,一开始是希望把眼控技术用在Google Glass这样的可穿戴产品上面。

从2013年,他们转向了VR,2016年与HTC合作推出可以应用到Vive上的VR眼球追踪模组“aGlass”。aGlass得到HTC Vive官方认证,可以内置到Vive头显中,为其增加多项基于眼球追踪技术开发的功能,包括注视点渲染、眼控交互、眼动大数据和眼控游戏。

深度 | 巨头都在追逐的眼球追踪技术,究竟能带来什么?

图 | 七鑫易维眼球追踪模组"aGlass"

2016年,英伟达确认与北京七鑫易维科技有限公司展开合作,共同助力VR产业。在VR火爆的元年,英伟达确定了VR开发者计划,提供硬件测试平台,推出GameWorks VR方案,向开发者开放NVIDIA VR SDK和提供相应的开发工具。

七鑫易维CEO黄通兵告诉雷锋网:“七鑫易维与英伟达的合作主要是PC VR产品的注视点渲染(Foveated Rendering)技术方面合作,我们需要英伟达底层API和硬件加速支持,才能实现最佳效果,最高降低GPU负荷到原来的十分之一,日后注视点渲染会成为PC VR的标配技术。”

同时,高通在IFA 2016大会上,发布了一款VR一体机参考设计——Snapdragon VR820,目前已经升级的二代搭载骁龙835芯片,能在低功耗下实现良好的图形渲染。高通投资了多家VR公司,在2014年以4000万美元投资七鑫易维。

雷锋网好奇七鑫易维与英伟达和高通这两家公司合作模式的不同,黄通兵表示:“高通在VR领域主要提供移动VR的高性能芯片方案,对于移动VR来说,计算能力相对PC VR较弱,对能耗也更敏感。所以,通过注视点渲染技术降低功耗、发热更加重要。此外,眼球追踪需要充分利用硬件核心来加速,高通在移动处理器中集成眼球追踪相关计算模块也是可以预见的。”

深度 | 巨头都在追逐的眼球追踪技术,究竟能带来什么?

图| 高通骁龙835 VR 一体机参考设计

各大巨头都在收购眼球追踪公司,可见眼球追踪技术已然成为未来人机交互、AR以及VR的基本技术。高通和英伟达作为基础硬件厂商,对于眼球追踪技术的应用能从底层设计上优化VR/AR体验,而三星、Google和Facebook这样的VR厂商或许能在应用场景和操作设计上给我们更多的惊喜,当然苹果的举动向来更喜欢出其不意。

眼球追踪解决VR/AR三大问题

Oculus的创始人Palmer Luckey曾表示,眼部跟踪技术会成为VR技术未来的一个“重要组成部分”。不仅能实现注视点渲染技术,它还能用来创造一种视觉深度,以创作出更好的用户界面。

(1)减少眩晕

VR要带给人沉浸感,就要做到能让人在虚拟空间里自然运动,这需要通过运动追踪来改变场景的呈现。目前的VR设备主要是利用空间定位技术来捕捉人的身体的位置运动,用惯性传感器来捕捉人的头部的运动,人在转动头部时,视角会发生相应的变化。

但是这只是比较初级的动作捕捉,人其实大多数时候都是通过转动眼球而不是头部来改变视觉。人们习惯用眼球转动(而不是头部转动)去观察。

目前的VR只追踪头部不追踪眼球运动容易使人眩晕(Motion Sickness)。人类对于头部转动和相对应的视野的变化是极度敏感的。如果用户的头转动了,而相对的,视野转动有延迟,只要很微小的延迟就能感觉得到。有多微小呢?研究表明,头动和视野的延迟不能超过20ms,不然就会非常明显。而眼球追踪技术运用在这里正好可以解决这一问题,以眼球的变化来控制场景的变化。

(2)注视点渲染

场景的变化很必要,但是要让VR呈现出同自然世界一样的场景和空间感所需的信息量和计算量是极大的。目前的VR大多数是将全部场景以同等的清晰度来呈现,用户移动头部和身体时虚拟物体也会相应地变换位置,视点拉近和退后都会影响景深,这些变化都需要大量的计算和不断更新。

目前的VR能达到每秒36次的刷新,而要达到人眼场景转换的速度则需要2000-3000次每秒,要实时渲染出这些场景,就连很高配的电脑都达不到。

而事实上,VR根本就不需要也不应该以全部的清晰度来呈现场景里的所有物体。在日常生活中,我们都明白“近大远小”,并且当我们注视一个物体时,这个物体会变清晰而其他物体会变模糊,这样我们看物体才有空间感和景深。如果当我们的视线转移了,画面中的物体还是全部清晰的,那么我们的眼睛就会感到“不适应”,并且会因为处理过多信息而疲劳。

深度 | 巨头都在追逐的眼球追踪技术,究竟能带来什么?

图 | 注视点渲染的效果

注视点渲染可以解决VR里画面呈现的问题,通过追踪眼睛的注视点,计算机可以只清晰渲染出注视点的场景,而将周边的场景模糊呈现。这样我们眼睛在虚拟环境中看物体和在自然场景中看物体的体验就会变得一致,这样虚拟和现实的切换就不会有明显的障碍,由视点和运动带来的眩晕也会减轻。

Oculus首席科学家Michale Abrash在谈及VR趋势时说道,VR将在5年内解决聚焦的景深问题。而视点渲染技术和眼球追踪技术是关键的解决办法。前文已写到,英伟达与七鑫易维展开合作将从底层技术实现GPU基于眼球追踪的注视点优化渲染技术。

(3)眼球触发的交互界面

VR中的交互目前还是一个尚需探索的领域,用户已经习惯了2D的平面界面信息呈现,在进入VR里时会出现信息迷失的状态。在很多的试验中发现,用户不会通过转动头部来获取整个环境信息,也很难自己找到隐藏的菜单和选项,通常需要工作人员的指引或者是游戏语音的引导。

眼控VR将会为VR带来全新的玩法,在射击类游戏中可以由眼睛控制光标锁定,当用户闭上一只眼时自动调出瞄准镜等,还可以根据玩家在游戏场景中注视点不同触发不同的剧情,当玩家注视路口时,会自动出现地图导航,当注视NPC不同部位触发不同的剧情等。除此之外眼控的交互方式还可以应用于游戏菜单,不需要使用的菜单会自动隐藏,使用时通过眼控触发,使VR界面更加干净。

当然,虚拟现实中的交互方式还有待探索,不管是Leap Motion主张的手势交互,还是眼球控制的技术点交互,都必须符合人们的交互习惯。

眼球追踪的下一步怎么走?

虽然各大巨头都各自收购、投资了眼球追踪技术公司,眼球追踪技术在解决VR因为的眩晕症、提升沉浸感、增强交互方面都有极大的作用,眼球追踪技术已然成为AR/VR发展的关键性和基础性技术。但是目前有一些显在的问题需要解决。

(1)眼球追踪产品价格高昂

Tobii Glass 2 售价最低为 14900 美元,高级版 29900 美元,包括了眼镜、辅助记录器和分析软件。七鑫易维的眼控模组aGlass的售价是单眼1500元,包括一个眼控追踪配件和三个分别是200度、400度、600度的近视镜片。The Eye Tribe的眼球追踪开发者套件,售价99美元,面向消费者的眼球追踪盒子,售价199美元。

黄通兵表示,将眼球追踪模组化集成到头显内有望将成本降低到20-30美元,但是即使这样,要HTC、Oculus这样的头盔厂商消化这部分的成本,需要扩展眼球追踪技术的应用场景。目前眼球追踪的最大价值在于在于与英伟达、AMD这样的GPU厂商合作,利用注视点渲染技术降低VR头显对GPU的需求。

(2)设备可用性有待提升

眼球追踪技术针对人眼,因此要对人眼的生物体征有很好的了解,眼球追踪设备需要能够识别出不同的健康程度、不同肤色、不同特征的人眼。目前仅是近视这个问题就会困扰很多做智能眼睛和VR头盔的用户,更不用说一些患有斜视的用户。

另外,我们可以看到目前眼球追踪的设备有各种不同的形态,包括Tobii的智能眼镜、The Eye Tribe的眼球追踪盒子、七鑫易维的VR眼控模组。眼球追踪盒子的形态显然更适用于电脑,智能眼镜可以整合到AR眼镜里。

(3)VR/AR应用差异较大

目前来看,眼球追踪技术应用于VR是一个必然的趋势,目前已有带眼球追踪的VR头盔Fove,各大厂商也计划推出有眼球追踪功能的VR一体机。

英伟达主要是希望以眼球追踪技术帮助VR做注视点渲染,降低GPU负载,专注移动VR的高通的移动处理器可能集成眼球追踪算法,更好地支持移动VR体验。

虽然在此文主要集中分析VR,但是眼球追踪在AR的应用也是不可忽视的,AR在未来的应用场景会比VR更为广阔。

记者在采访国内另一家眼球追踪技术公司“上海青研”时了解到,相比于VR,上海青研更为倾向于眼球追踪在AR上的应用,青研结合眼控技术与AR技术,在可穿戴的AR眼镜上添加眼控模组。

“AR眼控技术与VR眼控技术的应用场景不同:VR看的是虚拟世界,AR看的是真实世界;VR偏重娱乐更多一些,AR偏重实用更多一些;VR to C更多一些,AR to B更多一些。青研公司开发AR眼控技术是为了满足B端客户的需求。”青研CEO杜煜解释到。AR和VR不仅在客户群,应用场景上有不同,需要解决的问题也有很大不同。

杜煜认为:“AR眼控技术与VR眼控技术的主要不同在于:VR眼控需要把眼睛注视点坐标和VR屏幕对应,AR眼控需要把眼睛注视点坐标和真实世界的物体坐标对应,所以在VR眼控技术的基础之上,AR还需要拍摄用户前方的真实场景,并将眼睛注视点坐标与真实场景建立起三维的对应关系。AR眼控的主要难点有:

通常VR屏幕是2D的,但AR前置场景是3D的。3D位置坐标与眼睛注视点的匹配比2D坐标与眼睛注视点的匹配更复杂。

AR眼控比VR眼控要求体积更小,功耗更低,工业设计、结构设计、电路设计的要求更高。

AR眼控很多场合是室外使用,VR一般是室内使用,AR眼控对室外阳光的抗干扰能力要求更高。

(4)合作模式不明朗

2016年,风投机构Accel Partners的科比·富勒(Kobie Fuller)说:“眼球追踪技术可能非常强大,但从投资角度看,还无法确定其具备的价值。现在有价值数十亿美元的眼球追踪技术公司吗?我还不知道。”

从目前各大巨头对眼球追踪技术公司收购的金额来看,价值数十亿美元的眼球追踪技术公司并不是不可能。7月16日,美国市场研究机构MarketsandMarkets发布了关于眼动追踪市场的分析报告,其预计该市场在2023年将达到13.765亿美元的市值,2017年-2023年的年均复合增长率为27.4%。眼球追踪的软件和硬件在这几年都会呈明显上升趋势。或许现在仍不明朗的是合作模式,眼球追踪会成为独立的产品还是作为内嵌技术?

目前我们看到,眼球追踪公司也都在生产眼动仪,智能眼镜等to C的产品,以及开些帮助企业开发的to B产品,同时也在与大厂合作,做VR/AR的外接或内嵌技术,商业模式相对灵活。但是却始终没有获得一个明显的发展。VR和AR的发展对眼球追踪技术或许能带来不一样的活力。

小结

目前苹果、谷歌、Facebook、英伟达、高通这些巨头公司几乎占领互联网和移动互联网的大半壁江山,也主导着人工智能、自动驾驶、AR/VR等前沿技术的发展。资本+技术,巨头们的任何一个举动都可能有改变我们的生活的潜力,而雷锋网通过长期的行业报道发现,近年来巨头们都在积极布局眼球追踪技术,除了眼球追踪在人机交互的巨大潜能以外,眼球追踪技术还可能成为VR和AR的基础性技术,为AR的VR的发展提供必要的支持。虽然未来还有不少挑战,但是我们很欣喜地看到在眼球追踪技术上,中国公司的发展已经完全与国外接轨,站在同一竞争舞台上。


原文发布时间: 2017-08-02 15:56
本文作者: 雷锋网
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
传感器 人工智能 算法
外骨骼机器人混战:程天科技做“深”,傅利叶智能做“广”
外骨骼机器人商用范围愈加广泛,产业发展不断提速。
97 0
|
机器学习/深度学习 人工智能 自然语言处理
当AI遇上“网红”元宇宙,将带来怎样的变化?
如果说元宇宙是互联网发展的下一趋势,那么人工智能则是实现元宇宙重要的底层支撑技术。人工智能将使元宇宙更具沉浸感,极大提升用户体验。
362 0
当AI遇上“网红”元宇宙,将带来怎样的变化?
|
机器学习/深度学习 人工智能 达摩院
从憧憬中来,到革新里去,记录科技改变世界的魔幻之年 | 趋势预测
从憧憬中来,到革新里去,记录科技改变世界的魔幻之年 | 趋势预测
151 0
从憧憬中来,到革新里去,记录科技改变世界的魔幻之年 | 趋势预测
|
人工智能 自然语言处理 语音技术
出门问问获得谷歌战略投资,打造人工智能软件、硬件和服务的深度融合
国内人工智能创业公司出门问问宣布完成C轮融资,由谷歌投资,本轮融资后,出门问问估值3亿美金。截至本轮融资,出门问问自成立之日起已经获得了7500万美元的融资。
246 0
|
机器学习/深度学习 人工智能 自然语言处理
阿里、头条15 位科学家「预言未来」,2018科技将呈现何种趋势?
15 位不同领域的科学家,对 IoT、量子计算、边缘计算、自然语言处理、区块链、自动驾驶等前沿技术将在 2018 年如何影响世界、影响社会生活做出了自己的预测。
1797 0