梦想照进现实 - AR/VR 篇 (作者:方如)

本文涉及的产品
图像搜索,7款服务类型 1个月
简介: 毋庸置疑,图像识别、三维感知与跟踪、人机交互和三维渲染是AR/VR 四个核心部分,从这些方面下功夫,在实战中做好技术积累,更好地实现新零售下的内容升级,为下一代的计算平台打基础。 在CES 2017大展上,Kino-mo公司的展台前面挤满了人。

1.png

在CES 2017大展上,Kino-mo公司的展台前面挤满了人。究竟是什么这么吸引人呢?原来这家公司利用全息裸眼方案 Kino-mo Holo Displays向观众展示了酷炫和惊艳的3D画面,令观众大饱眼福。这款AR产品主要由LED及旋转叶片投影机组成,当较细的叶片旋转后,会有一种透明消失的感觉。之后再将视频画面展示在高速旋转的叶片之上,造成投影在空气中的假象,加上特殊处理的3D视频,效果很逼真。

 VR/AR CES展台情况
AR能产生各种惊艳的效果。言归正传,我们来看看CES 2017 VR/AR 展台的大致情况。今年三大头显缺席CES,CES不再是三大头显的天下了。随着生态型企业的陆续进入,降低了VR/AR进入门槛,促成了越来越多的厂商携自己的VR/AR 相关产品亮相CES。为此,今年CES主办方单独为VR/AR开设专区,可见,VR/AR已经成为一股不可忽视的新生力量。

具体地,微软在未来的几个月内还将和戴尔、宏碁、惠普、联想和3Glasses合作一起推更加低廉的类HoloLens的AR一体机。英特尔也宣布,Project Alloy将于2017年第四季度正式发货。 Alloy将采用英特尔最新第7代CPU和RealSense,前部搭载鱼眼镜头以及传感器。这两家在智能手机时代失势的巨头都希望能够抓住移动VR/AR这一波趋势。

毋庸置疑,本次CES微软的VR/AR阵营、英特尔的Project Alloy和谷歌Daydream、Tango阵营成为新焦点。可以看出,谷歌Daydream家族越来越庞大,支持Daydream平台的手机除了谷歌自家的Pixel和Pixel XL,还有Moto Z、ZDroid以及Axon 7,未来三星、LG、HTC、小米、阿尔卡特等手机厂商也将加入谷歌Daydream阵营。

屏幕快照 2017-02-08 下午2.23.08.png

屏幕快照 2017-02-08 下午2.23.17.png

有个非常意思的事情,按照常人的逻辑,高通、英特尔、Nvidia 本应是井水不犯河水,他们之间本没有太多正面的竞争,但那是PC、移动互联网时代的行业划分,已经过时了。从这次CES 来看,三者的交集越来越多,人工智能、VR/AR、物联网和无人驾驶等领域将成为下一个火药味十足的战场。所以阿里集团必须在这些方面有所为,否则非常被动,只能沦为看客。

 AR的挑战

VR 成为潮流所趋,AR 会更加鼎盛。AR的表现形态更贴合线上线下购物的诉求。我们着重分析一下AR目前所面临的挑战。归纳起来有五点,分别是移动性、爆款设备、续航能力、app生态系统和电信公司跨行业补贴。

从本次CES上我们可以看出AR移动化趋势十分明显。要想随时随地传输具有沉浸感的优质的内容,需要有高速的移动网络支持。越来越多的AR设备支持移动连接。英特尔、高通和华为都在5G网络上频频发力。英特尔推出了业界首款同时支持6GHz以下频段和毫米波频段的5G调制解调器。凭借这款调制解调器,英特尔在高通最擅长的领域先下一局,让人刮目相看。

由于AR涉及到复杂的图像识别跟踪和3D渲染,对CPU和GPU的计算能力和功能都提出了更高的要求。NVIDIA分别推出了Drive PX、 Drive PX 2这两个计算平台,其中Co-Pilot包括面部识别、头部追踪、视线追踪以及读唇技术,GeForce与Facebook Live平台合作,游戏、AR/VR、数据中心和自动驾驶是NVIDIA的四大业务,而计算能力在这几个领域中都将发挥重要作用。至于电池续航能力,高通、Intel和Nvidia等公司已经意识到这方面的问题,正在大力研究处理器的智能化电池管理。例如骁龙835已经不仅仅是一款手机处理器,高通宣称这款处理器完全适合无人驾驶、VR/AR等更复杂的领域。

其实硬件并不是阻碍未来几年制约AR普及的主要障碍,相反,有吸引力的内容的缺乏、AR应用用户体验问题以及开发成本高是我们需要解决的紧迫问题。Vuforia等AR SDK 提供商为了普及AR应用,打造了内容制作及分发平台,提供模型、动画和配音音效的制作工具,满足用户多样化的需求。Fyusion 建立了专为移动设备打造的 AR 内容制作平台。通过计算机视觉和机器学习技术,创造了一个基于手机端的平台,用于创建 AR 内容。CapturingReality公司开发了一整套捕捉和还原3D模型的技术,提供编辑器,供美术使用。

 AR设备是眼镜还是手机?

眼镜方面,科叔宣布Intel Project Alloy将开放给开发者,并计划与顶级 OEM 合作,并且将在2017年Q4推出 Project Alloy 的消费版产品,第三方厂商都可以推出基于这套方案的产品。许多国内外厂商推出了AR 眼镜,从分辨率、FOV和计算性能等方面做比较,还是微软的Hololens AR 设备表现最好。但就是Hololens AR 眼镜也才刚刚及格,还有很长的路要走。

从长时间续航能力、app生态系统、移动性和电信补贴来看,眼镜设备都不占优势,相反手机已具备上述特征。ASUS在CES上发布Zenfone AR Tango 手机,预载的 Android 7.0 Nougat系统支持 Daydream VR 功能,用户用一部手机玩尽 Google 的AR 和VR两大功能。用户只需将 Zenfone VR 放入 Google的Daydream VR 装置就可以使用 Daydream Apps,而开放 Tango 模式就能使用 Tango Apps。不久,华为表示会继联想和华硕后加入 Tango 圈子。BMW 也宣布进一步将 Tango 技术运用到营销体验上,销售人员透过应用程序就可以让客户看到 BMWi3 系列的内装及其细节。

虽然AR 眼镜和AR手机相继问世,但是市场上还是缺乏像在移动互联网拉开时候iphone那样的标志性设备。

 AR/VR团队的切入点和抓手

在2017年移动平台总结和规划会上南天提醒我们要看外部形势,结合外部形势,以及我们业务和技术的特点来思考团队的目标和抓手。前面我们分析了AR/VR现状和未来发展趋势,那么阿里在这个形势下需要做哪些储备呢?毋庸置疑,图像识别、三维感知与跟踪、人机交互和三维渲染是AR/VR 四个核心部分,从这些方面下功夫,在实战中做好技术积累,更好地实现新零售下的内容升级,为下一代的计算平台打基础。

  1. 图像识别、三维感知与跟踪:AR目前主要还是利用自然特征识别。随着大数据的迅猛发展,深度学习技术越来越被众多公司采纳。Aipoly 是从视频中获取物体信息转换成语音说明的一款app,获得了CES2017 Innovation Awards,从中可以看到组委会对图像识别技术的期望。它利用了深度学习技术来训练识别模型,与拍立淘的区别是从视频中连续识别物体,并能转换成语音表达。

主流的深度学习框架有Tensorflow、Caffe、Convnet和CNTK等,我们比较了这几种深度学习框架,确定以Tensorflow 为基础训练,发展可运行在移动端的深度学习模型。不过,深度学习不可能是一招鲜,吃遍天,需要把自然特征识别与深度学习有机结合起来使用。

集团很多BU在深度学习有深入地研究,淘宝通过各种营销和商品推广的实际项目推动和实现了在AR级别上的即时定位与地图重建的算法产品化,如果这两方面很好地结合,进一步提升识别的准确性和跟踪的稳定性,在AR底层的图像识别、三维感知与跟踪技术上形成阿里的核心竞争力。

  1. 人机交互:在人机交互中我更倾向于使用自然交互。我比较了语音识别、手势识别、头部和眼球跟踪等几种通用的自然交互方式,发现语音的输入是我们与设备交互最简单、最有效、最舒适的方式。在这里建议阿里更深入研究地购物场景的语音识别,培养用户使用语音的心智。同时,把语音识别模块移植到智能设备和手机应用中,支持集团内外的商业使用,形成类似Amazon Alex那样的生态链。
  2. 自动建模:3D 商品模型数量固然重要,但是具有3D自动建模能力和内容制作的体系化才是更重要的。结合商品、场景和人物重建的不同特点,实现2D转3D和三维重建技术的突破,形成适合商业化运作的产品体系,提供商家制作3D手段,加速商品内容升级。
  3. 共建和合力:大家都看到力AR的作用和价值,集团很多BU都成立了AR实验室,百度也成立了AR Lab。而GM Lab 从事VR/AR研发已经很久,并成功实现了buy+ 和AR 捉猫猫等多种案例,这个时候与各个部门的AR 实验室共建,把我们的平台和经验分享出去,促成集团使用统一的接口和建模标准,推动集团相关技术和标准的对外输出。

目录
相关文章
|
1月前
|
5G 测试技术 语音技术
5G赋能沉浸式体验:VR/AR时代的网络基石
5G赋能沉浸式体验:VR/AR时代的网络基石
58 1
|
2月前
|
编解码 vr&ar 芯片
VR与AR:未来的科技趋势
【8月更文挑战第26天】VR与AR技术正以前所未有的速度发展,并在市场规模、技术创新、应用场景以及竞争格局等方面展现出强劲的增长潜力。随着技术的不断进步和应用场景的不断拓展,VR/AR/MR技术将为人们带来更加丰富的虚拟体验和更加便捷的生活方式。未来,我们有理由相信,VR与AR技术将在多个领域实现更广泛的应用和更深入的融合,成为推动社会进步的重要力量。
|
2月前
|
vr&ar C# 图形学
如何开发增强现实(AR)应用:技术指南与实践
【8月更文挑战第24天】开发增强现实应用是一个充满挑战和机遇的过程。通过选择合适的技术栈、遵循科学的开发步骤,并充分考虑用户体验、设备兼容性、内容与创意以及数据安全等因素,您可以成功打造一款高质量的AR应用。随着技术的不断进步和应用场景的不断拓展,AR应用的未来充满了无限可能。
|
2月前
|
人工智能 搜索推荐 算法
探索增强现实(AR)在零售业的潜力:重塑购物体验的未来
【8月更文挑战第7天】增强现实技术正在逐步改变零售业的面貌,为消费者带来全新的购物体验。从虚拟试衣间到产品信息展示,从营销创新到线上线下融合,AR技术在零售业的应用潜力巨大。随着技术的不断进步和应用场景的不断拓展,我们有理由相信,未来的零售业将更加智能、便捷和个性化。作为行业从业者,应积极拥抱AR技术,不断创新和优化自身的业务模式和服务方式,以适应市场的变化和消费者的需求。
|
2月前
|
vr&ar 图形学 开发者
步入未来科技前沿:全方位解读Unity在VR/AR开发中的应用技巧,带你轻松打造震撼人心的沉浸式虚拟现实与增强现实体验——附详细示例代码与实战指南
【8月更文挑战第31天】虚拟现实(VR)和增强现实(AR)技术正深刻改变生活,从教育、娱乐到医疗、工业,应用广泛。Unity作为强大的游戏开发引擎,适用于构建高质量的VR/AR应用,支持Oculus Rift、HTC Vive、Microsoft HoloLens、ARKit和ARCore等平台。本文将介绍如何使用Unity创建沉浸式虚拟体验,包括设置项目、添加相机、处理用户输入等,并通过具体示例代码展示实现过程。无论是完全沉浸式的VR体验,还是将数字内容叠加到现实世界的AR应用,Unity均提供了所需的一切工具。
99 0
|
2月前
|
vr&ar C# 图形学
WPF与AR/VR的激情碰撞:解锁Windows Presentation Foundation应用新维度,探索增强现实与虚拟现实技术在现代UI设计中的无限可能与实战应用详解
【8月更文挑战第31天】增强现实(AR)与虚拟现实(VR)技术正迅速改变生活和工作方式,在游戏、教育及工业等领域展现出广泛应用前景。本文探讨如何在Windows Presentation Foundation(WPF)环境中实现AR/VR功能,通过具体示例代码展示整合过程。尽管WPF本身不直接支持AR/VR,但借助第三方库如Unity、Vuforia或OpenVR,可实现沉浸式体验。例如,通过Unity和Vuforia在WPF中创建AR应用,或利用OpenVR在WPF中集成VR功能,从而提升用户体验并拓展应用功能边界。
50 0
|
3月前
|
传感器 人工智能 数据可视化
虚拟现实(VR)与增强现实(AR)的技术革新:塑造未来的沉浸式体验
【7月更文挑战第24天】VR和AR作为两种前沿的沉浸式技术,正以前所未有的速度改变着我们的世界。随着技术的不断革新和应用的不断拓展,我们有理由相信,未来的VR和AR将为我们带来更多令人惊叹的体验和技术革新。