「镁客·请讲」七鑫易维黄通兵:追求更自然的人机交互,眼球追踪技术正在路上

简介:

“行业内的公司既有被收购的,也有自己独立上市的,所以一切皆有可能吧。”

最近,微软在win 10 的最新版本中,加入了“眼球追踪”功能,通过凝视来完成一些基本的文本输入操作,而之所以会增加这个功能,微软表示想要帮助那些患有神经肌肉疾病的人,比如渐冻症患者,让他们直接用眼神和系统中各种元素交互。

眼球追踪技术似乎正在一点点侵入到我们的生活。去年,七鑫易维推出了全球首款VR眼球追踪模组aGlass,展现了他们的注视点渲染、眼控交互和眼动数据分析三大“黑科技”。

从最早的医疗辅具到PC上的辅助再到虚拟现实体验,今天我们就和七鑫易维的创始人黄通兵聊聊眼球追踪技术。

被收购or自己成长壮大,一切皆有可能

黄通兵是在2009年创建的七鑫易维,最初的时候他也没想到自己会出来创业。

在沈阳航空航天大学任职期间,黄通兵捣鼓了一些项目,然后无心插柳柳成荫,他成功地将自己做的软件卖给了一家军工企业。

七鑫易维黄通兵:追求更自然的人机交互,眼球追踪技术正在路上

(七鑫易维创始人&CEO黄通兵)

而黄通兵最先研究的是偏战斗机飞行器相关的眼控技术,“当时眼球追踪是飞行员军用瞄准头盔上一个在研的技术。”

卸下老师的身份后,黄通兵在工作上也遇到不少坑,但也正是那些路上的荆棘,有了今天的七鑫易维。

“其实公司成立之初,就是从这种穿戴式的头显出发,当时主要用于医疗辅具上,后来包括普通的台式一体机这些”,七鑫易维创建后不久,他们就成功地把眼控仪销售给ALS人群(渐冻人),并且与相关的残疾人协会进行合作。

而随着近几年VR/AR突然窜头,眼球追踪技术也看到走向消费级应用的曙光,七鑫易维自然不会错过这次机会。所以他们也顺势推出了首款VR眼球追踪模组aGlass。

七鑫易维黄通兵:追求更自然的人机交互,眼球追踪技术正在路上

(全球首款VR眼球追踪模组aGlass)

但是将这个有点黑科技概念的技术做到一个消费级水平并不是容易的事情,这也是为什么行业内会连续出现大公司收购技术创企的新闻:

2017年6月,苹果收购了专注于眼球追踪技术的德国公司SensoMotoric Instruments;

2016年12月,Facebook收购了眼球追踪公司The Eye Tribe;

2016年10月,谷歌收购了眼球追踪技术公司Eyefluence。

科技巨头们在收购的同时,与眼球追踪相关的一系列专利也悉数收入囊中,由此可见眼球追踪的技术门槛也非常高。

当问到七鑫易维之后会不会委身于大公司,黄通兵打了个‘马虎眼’,“行业内的公司既有被收购的,也有自己独立上市的,所以一切皆有可能吧。”

千人有千眼,先从基础的数据采集开始

眼球追踪技术的门槛高,直到现在技术本身也没有一个完整的解决方案,而眼球的数学模型目前也不完备。

七鑫易维黄通兵:追求更自然的人机交互,眼球追踪技术正在路上

如黄通兵所说,“千人有千眼,每个人的眼睛都是独一无二的,有的眼睛斜视,有的眼睛近视或者远视,甚至还有一些眼部的疾病。同时戴眼镜的情况也特别多。在这种情况下,要做全眼球相关的数据也是一个难度大,且需要长期积累的事情。”

以数据采集为例,七鑫易维最初将眼球追踪技术应用到医疗领域的时候,就已经有计划地采集一些数据,尤其是比较特殊的一些眼球方面,“这么多年,我们一直在积累这方面的数据。”

当然,这也是七鑫易维和其他竞争对手相比所保有的优势。

从2014年到2016年,七鑫易维相继得到高通、中兴合创、国科等知名机构的投资,所以在芯片以及核心传感器方面,他们都会有全面的资源和国际巨头公司的背书。

基于此,七鑫易维的眼球追踪模组aGlass的DK1版本很快得到HTC Vive的官方认可,“作为首款眼球追踪配件,我们推出市场后更多的是起到教育市场和培育开发者的作用。”黄通兵介绍,他们正在准备DK2的版本。相比较之前主要面向开发者的版本,新的追踪模组推出的同时会附带相关的内容体验,包括一些基于眼动数据的个性化服务。

其实从镁客君的体验来看,很少能看到带有眼球追踪的VR内容,黄通兵也是心有戚戚,“内容体验方面目前还没有特别面向大众的应用推出,推出眼球追踪模块也是为了让开发者更快熟悉技术,只有不断出现新的内容支持眼球追踪技术,才可能让消费者真正去接受并且把这个东西玩起来。

等待眼球追踪技术来改写更自然的人机交互

虽然现阶段用眼球追踪交互的内容还比较少,但不可否认眼球追踪带来的是更加自然的人机交互体验,从这个角度来看,它非常适合于一些VR场景。

七鑫易维黄通兵:追求更自然的人机交互,眼球追踪技术正在路上

(眼控交互)

“在现有的一些VR游戏中,瞄准都是一个大难题,你得拿着方向键或者晃头,这些都没有只用眼球直接瞄准来的爽。”黄通兵认为,对于VR/AR来说,眼球追踪是最好的人机交互之一,而且相比语音、手势识别以及带有外设的其他交互方式,它也更加适合穿戴式的环境。

黄通兵说了几个实际应用的例子:比如体验一些VR游戏,眼睛看着目标就可以锁定,而在一些惊悚类的游戏中,可以设计出这样一种机制,当出现恐怖情节的时候,玩家闭上眼不敢看,就会触发掉血的机制。

问题来了,如果仅仅依靠眼球的运动来完成所有的交互,造成视觉疲劳会怎么办?

黄通兵表示,基于眼球追踪的交互更多是一种“弱交互”,它不是让玩家一直“拼命”地盯着目标物体。“我们把眼球追踪定义成用户在潜意识中就可以进行的操作,我们会在后台分析大量的眼动数据,当触发相应的操作,其实他们并不一定可以察觉到。而且在具体的应用中,眼球追踪只是起瞄准作用,射击之类的操作还是要通过手柄来完成。”

七鑫易维黄通兵:追求更自然的人机交互,眼球追踪技术正在路上

(注视点渲染技术)

眼球追踪技术之于VR,不仅仅交互方式上的创新,其中涉及到的注视点渲染技术,也能从底层去减少GPU资源的消耗。黄通兵介绍,“通过注视点渲染技术,我们直接把渲染量减少,在提升性能的同时,减少GPU的载荷。以VRFunhouse为例,本来需要双1080显卡才能流畅运行的场景,应用注视点渲染技术后,使用单1070显卡就可以让场景流畅运行,渲染帧率从45帧左右提升到将近90帧,延迟则由23ms左右降低到11ms左右。这样的表现在GTC大会上也得到了NVIDIA CEO黄仁勋的肯定与支持”

从整个行业来看,眼球追踪技术还处在一个成长期,相比较手势识别这些交互方式,发展的步伐可能会稍慢一些。黄通兵深谙此理,所以七鑫易维的下一步计划是将眼球追踪技术推广到消费级的VR/AR设备上,鼓励开发者围绕它做出更多的应用,从而推动眼球追踪技术地不断成熟。

结语:

在镁客君采访的诸多技术创企中,七鑫易维的眼球追踪技术应该是离消费者最远的VR/AR技术之一,所以它的发展以及成长空间非常大。但是另一方面,我们也看到随着VR这样新兴产业的到来,也正在让更多黑科技一点点揭开神秘的面纱,朝着平民化、消费级方向发展。

当然,技术的推广和应用也需要找到一个合适的场景,然后不断去磨合。关于这个问题在镁客网9月8日协办的虚拟现实发展大会上也会深入地探讨,感兴趣的不妨来现场听听像七鑫易维这样的技术创企现身说法。


原文发布时间: 2017-08-18 17:04
本文作者: 巫盼
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关文章
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
36_T5与编码器-解码器架构
T5(Text-to-Text Transfer Transformer)是由Google Research于2019年提出的一种革命性的预训练语言模型。它的核心创新在于提出了一种统一的框架,将所有自然语言处理(NLP)任务都转换为文本到文本的格式,即输入和输出都是文本序列。
|
3月前
|
运维 安全 测试技术
Hydra-SSH 漏洞安全防范
Hydra 是由 THC 组织开发的强力网络安全测试工具,主要用于对 SSH、FTP、HTTP 等协议进行认证爆破,适用于授权渗透测试与弱口令检测。其高效性依赖于优化的字典策略,强调质量优先,结合目标信息定制密码列表,提高破解成功率。
417 1
|
9月前
|
安全
困扰数学家近60年的搬沙发难题疑似被解决!119页论文证明最优解
搬沙发问题自1966年由Leo Moser提出以来,一直是数学界的未解难题。该问题旨在寻找能通过单位宽90度转角走廊的最大平面图形。1992年,Joseph Gerver提出一个面积约为2.2195的近似解“Gerver沙发”,但最优性未被证明。2024年,延世大学数学家Jineon Baek发表论文,声称通过几何推理和Mamikon定理等工具,证明了Gerver沙发为最优解。Baek的证明创新性高且避免计算机辅助,但仍需进一步验证。这一进展引发数学界广泛关注与讨论。
249 9
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
《探秘Hiplot:AI如何为上千图表模板实现精准分类推荐》
Hiplot是一款免费且功能强大的数据可视化AI,拥有上千种图表模板。它通过多维度数据理解、用户意图识别、机器学习模型和实时反馈优化等技术,实现精准的图表推荐。首先,AI对用户数据进行深度剖析,理解时间、产品、地域等维度特征;其次,利用自然语言处理识别用户需求;再者,基于大量历史数据训练的机器学习模型预测最适合的图表;最后,通过实时收集用户反馈不断优化推荐策略。这一系列AI技术的应用,使Hiplot能高效提供最合适的可视化方案,助力数据洞察与决策。
402 11
|
12月前
|
存储 人工智能 运维
AI-Native的路要怎么走?一群技术“老炮儿”指明了方向
上世纪70年代,沃兹尼亚克、乔布斯等人成立Homebrew Computer Club,推动个人电脑普及。如今,创原会承袭这一精神,由CNCF执行董事Priyanka Sharma等构建,聚焦云原生和AI技术,汇聚各行业技术骨干,探索前沿科技。2024年创原会年度峰会达成“全面拥抱AI-Native”共识,解决算力与存储瓶颈,推动AI原生应用开发,助力千行万业智能化转型,成为行业创新风向标。
218 8
|
安全 API 数据安全/隐私保护
常见的HTTP请求方法
【10月更文挑战第25天】这些HTTP请求方法共同构成了客户端与服务器之间交互的基础,使得客户端能够根据不同的需求对服务器资源进行各种操作。在实际应用中,开发者需要根据具体的业务场景和资源的性质选择合适的请求方法来实现客户端与服务器之间的有效通信。
|
敏捷开发 安全 前端开发
改进产品的用户体验
【10月更文挑战第9天】改进产品的用户体验
426 2
|
机器学习/深度学习 数据挖掘
数据特征
数据特征
542 2
|
SQL 安全 Linux
命令执行漏洞
命令执行漏洞
|
Cloud Native Java 对象存储
揭秘微服务架构之争:Spring Cloud与Netflix OSS巅峰对决,谁将称霸弹性云原生时代?
近年来,微服务架构成为企业应用的主流设计模式。本文对比了两大热门框架Spring Cloud和Netflix OSS,探讨其在构建弹性微服务方面的表现。Spring Cloud依托Spring Boot,提供全面的微服务解决方案,包括服务注册、配置管理和负载均衡等。Netflix OSS则由一系列可独立或组合使用的组件构成,如Eureka、Hystrix等。两者相比,Spring Cloud更易集成且功能完善,而Netflix OSS则需自行整合组件,但灵活性更高。实际上,两者也可结合使用以发挥各自优势。通过对两者的对比分析,希望为企业在微服务架构选型上提供参考。
319 0