梦想照进现实 - AR/VR 篇 (作者:方如)-阿里云开发者社区

开发者社区> 六次元> 正文

梦想照进现实 - AR/VR 篇 (作者:方如)

简介: 毋庸置疑,图像识别、三维感知与跟踪、人机交互和三维渲染是AR/VR 四个核心部分,从这些方面下功夫,在实战中做好技术积累,更好地实现新零售下的内容升级,为下一代的计算平台打基础。 在CES 2017大展上,Kino-mo公司的展台前面挤满了人。
+关注继续查看

1.png

在CES 2017大展上,Kino-mo公司的展台前面挤满了人。究竟是什么这么吸引人呢?原来这家公司利用全息裸眼方案 Kino-mo Holo Displays向观众展示了酷炫和惊艳的3D画面,令观众大饱眼福。这款AR产品主要由LED及旋转叶片投影机组成,当较细的叶片旋转后,会有一种透明消失的感觉。之后再将视频画面展示在高速旋转的叶片之上,造成投影在空气中的假象,加上特殊处理的3D视频,效果很逼真。

 VR/AR CES展台情况
AR能产生各种惊艳的效果。言归正传,我们来看看CES 2017 VR/AR 展台的大致情况。今年三大头显缺席CES,CES不再是三大头显的天下了。随着生态型企业的陆续进入,降低了VR/AR进入门槛,促成了越来越多的厂商携自己的VR/AR 相关产品亮相CES。为此,今年CES主办方单独为VR/AR开设专区,可见,VR/AR已经成为一股不可忽视的新生力量。

具体地,微软在未来的几个月内还将和戴尔、宏碁、惠普、联想和3Glasses合作一起推更加低廉的类HoloLens的AR一体机。英特尔也宣布,Project Alloy将于2017年第四季度正式发货。 Alloy将采用英特尔最新第7代CPU和RealSense,前部搭载鱼眼镜头以及传感器。这两家在智能手机时代失势的巨头都希望能够抓住移动VR/AR这一波趋势。

毋庸置疑,本次CES微软的VR/AR阵营、英特尔的Project Alloy和谷歌Daydream、Tango阵营成为新焦点。可以看出,谷歌Daydream家族越来越庞大,支持Daydream平台的手机除了谷歌自家的Pixel和Pixel XL,还有Moto Z、ZDroid以及Axon 7,未来三星、LG、HTC、小米、阿尔卡特等手机厂商也将加入谷歌Daydream阵营。

屏幕快照 2017-02-08 下午2.23.08.png

屏幕快照 2017-02-08 下午2.23.17.png

有个非常意思的事情,按照常人的逻辑,高通、英特尔、Nvidia 本应是井水不犯河水,他们之间本没有太多正面的竞争,但那是PC、移动互联网时代的行业划分,已经过时了。从这次CES 来看,三者的交集越来越多,人工智能、VR/AR、物联网和无人驾驶等领域将成为下一个火药味十足的战场。所以阿里集团必须在这些方面有所为,否则非常被动,只能沦为看客。

 AR的挑战

VR 成为潮流所趋,AR 会更加鼎盛。AR的表现形态更贴合线上线下购物的诉求。我们着重分析一下AR目前所面临的挑战。归纳起来有五点,分别是移动性、爆款设备、续航能力、app生态系统和电信公司跨行业补贴。

从本次CES上我们可以看出AR移动化趋势十分明显。要想随时随地传输具有沉浸感的优质的内容,需要有高速的移动网络支持。越来越多的AR设备支持移动连接。英特尔、高通和华为都在5G网络上频频发力。英特尔推出了业界首款同时支持6GHz以下频段和毫米波频段的5G调制解调器。凭借这款调制解调器,英特尔在高通最擅长的领域先下一局,让人刮目相看。

由于AR涉及到复杂的图像识别跟踪和3D渲染,对CPU和GPU的计算能力和功能都提出了更高的要求。NVIDIA分别推出了Drive PX、 Drive PX 2这两个计算平台,其中Co-Pilot包括面部识别、头部追踪、视线追踪以及读唇技术,GeForce与Facebook Live平台合作,游戏、AR/VR、数据中心和自动驾驶是NVIDIA的四大业务,而计算能力在这几个领域中都将发挥重要作用。至于电池续航能力,高通、Intel和Nvidia等公司已经意识到这方面的问题,正在大力研究处理器的智能化电池管理。例如骁龙835已经不仅仅是一款手机处理器,高通宣称这款处理器完全适合无人驾驶、VR/AR等更复杂的领域。

其实硬件并不是阻碍未来几年制约AR普及的主要障碍,相反,有吸引力的内容的缺乏、AR应用用户体验问题以及开发成本高是我们需要解决的紧迫问题。Vuforia等AR SDK 提供商为了普及AR应用,打造了内容制作及分发平台,提供模型、动画和配音音效的制作工具,满足用户多样化的需求。Fyusion 建立了专为移动设备打造的 AR 内容制作平台。通过计算机视觉和机器学习技术,创造了一个基于手机端的平台,用于创建 AR 内容。CapturingReality公司开发了一整套捕捉和还原3D模型的技术,提供编辑器,供美术使用。

 AR设备是眼镜还是手机?

眼镜方面,科叔宣布Intel Project Alloy将开放给开发者,并计划与顶级 OEM 合作,并且将在2017年Q4推出 Project Alloy 的消费版产品,第三方厂商都可以推出基于这套方案的产品。许多国内外厂商推出了AR 眼镜,从分辨率、FOV和计算性能等方面做比较,还是微软的Hololens AR 设备表现最好。但就是Hololens AR 眼镜也才刚刚及格,还有很长的路要走。

从长时间续航能力、app生态系统、移动性和电信补贴来看,眼镜设备都不占优势,相反手机已具备上述特征。ASUS在CES上发布Zenfone AR Tango 手机,预载的 Android 7.0 Nougat系统支持 Daydream VR 功能,用户用一部手机玩尽 Google 的AR 和VR两大功能。用户只需将 Zenfone VR 放入 Google的Daydream VR 装置就可以使用 Daydream Apps,而开放 Tango 模式就能使用 Tango Apps。不久,华为表示会继联想和华硕后加入 Tango 圈子。BMW 也宣布进一步将 Tango 技术运用到营销体验上,销售人员透过应用程序就可以让客户看到 BMWi3 系列的内装及其细节。

虽然AR 眼镜和AR手机相继问世,但是市场上还是缺乏像在移动互联网拉开时候iphone那样的标志性设备。

 AR/VR团队的切入点和抓手

在2017年移动平台总结和规划会上南天提醒我们要看外部形势,结合外部形势,以及我们业务和技术的特点来思考团队的目标和抓手。前面我们分析了AR/VR现状和未来发展趋势,那么阿里在这个形势下需要做哪些储备呢?毋庸置疑,图像识别、三维感知与跟踪、人机交互和三维渲染是AR/VR 四个核心部分,从这些方面下功夫,在实战中做好技术积累,更好地实现新零售下的内容升级,为下一代的计算平台打基础。

  1. 图像识别、三维感知与跟踪:AR目前主要还是利用自然特征识别。随着大数据的迅猛发展,深度学习技术越来越被众多公司采纳。Aipoly 是从视频中获取物体信息转换成语音说明的一款app,获得了CES2017 Innovation Awards,从中可以看到组委会对图像识别技术的期望。它利用了深度学习技术来训练识别模型,与拍立淘的区别是从视频中连续识别物体,并能转换成语音表达。

主流的深度学习框架有Tensorflow、Caffe、Convnet和CNTK等,我们比较了这几种深度学习框架,确定以Tensorflow 为基础训练,发展可运行在移动端的深度学习模型。不过,深度学习不可能是一招鲜,吃遍天,需要把自然特征识别与深度学习有机结合起来使用。

集团很多BU在深度学习有深入地研究,淘宝通过各种营销和商品推广的实际项目推动和实现了在AR级别上的即时定位与地图重建的算法产品化,如果这两方面很好地结合,进一步提升识别的准确性和跟踪的稳定性,在AR底层的图像识别、三维感知与跟踪技术上形成阿里的核心竞争力。

  1. 人机交互:在人机交互中我更倾向于使用自然交互。我比较了语音识别、手势识别、头部和眼球跟踪等几种通用的自然交互方式,发现语音的输入是我们与设备交互最简单、最有效、最舒适的方式。在这里建议阿里更深入研究地购物场景的语音识别,培养用户使用语音的心智。同时,把语音识别模块移植到智能设备和手机应用中,支持集团内外的商业使用,形成类似Amazon Alex那样的生态链。
  2. 自动建模:3D 商品模型数量固然重要,但是具有3D自动建模能力和内容制作的体系化才是更重要的。结合商品、场景和人物重建的不同特点,实现2D转3D和三维重建技术的突破,形成适合商业化运作的产品体系,提供商家制作3D手段,加速商品内容升级。
  3. 共建和合力:大家都看到力AR的作用和价值,集团很多BU都成立了AR实验室,百度也成立了AR Lab。而GM Lab 从事VR/AR研发已经很久,并成功实现了buy+ 和AR 捉猫猫等多种案例,这个时候与各个部门的AR 实验室共建,把我们的平台和经验分享出去,促成集团使用统一的接口和建模标准,推动集团相关技术和标准的对外输出。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
怎么设置阿里云服务器安全组?阿里云安全组规则详细解说
阿里云服务器安全组设置规则分享,阿里云服务器安全组如何放行端口设置教程
6907 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
4479 0
使用OpenApi弹性释放和设置云服务器ECS释放
云服务器ECS的一个重要特性就是按需创建资源。您可以在业务高峰期按需弹性的自定义规则进行资源创建,在完成业务计算的时候释放资源。本篇将提供几个Tips帮助您更加容易和自动化的完成云服务器的释放和弹性设置。
7751 0
阿里云服务器安全组设置内网互通的方法
虽然0.0.0.0/0使用非常方便,但是发现很多同学使用它来做内网互通,这是有安全风险的,实例有可能会在经典网络被内网IP访问到。下面介绍一下四种安全的内网互联设置方法。 购买前请先:领取阿里云幸运券,有很多优惠,可到下文中领取。
9424 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,云吞铺子总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系统盘、创建快照、配置安全组等操作如何登录ECS云服务器控制台? 1、先登录到阿里云ECS服务器控制台 2、点击顶部的“控制台” 3、通过左侧栏,切换到“云服务器ECS”即可,如下图所示 通过ECS控制台的远程连接来登录到云服务器 阿里云ECS云服务器自带远程连接功能,使用该功能可以登录到云服务器,简单且方便,如下图:点击“远程连接”,第一次连接会自动生成6位数字密码,输入密码即可登录到云服务器上。
16819 0
阿里云服务器ECS登录用户名是什么?系统不同默认账号也不同
阿里云服务器Windows系统默认用户名administrator,Linux镜像服务器用户名root
1131 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
3227 0
+关注
六次元
张洁,花名方如,负责阿里巴巴人工智能实验室AR,原蚂蚁金服生物识别技术团队“柒车间”负责人,实现了支付宝人脸识别实名认证和证件审核从零到一的突破,在淘宝期间负责淘宝Buy+AR算法平台和多个AR/VR项目的实施。曾在北美、日本和中国多家高科技企业任技术总监。
14
文章
1
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载