分享人:
谭 雄 阿里巴巴达摩院XR实验室AR产品负责人
孙元科 上海诠视传感技术有限公司解决方案总监
李克非 松美术馆运营负责人
正文:
本篇内容将通过七个部分来介绍虚实交映:智能机器人实践。
一、AR行业的瓶颈与痛点
二、XR实验室的两大平台
三、诠视科技公司简介
四、SlimEdge XR的应用场景
五、现当代艺术史概览
六、XR与艺术结合实例
七、科技成就未来
一、AR行业的瓶颈与痛点
虽然AR行业风风火火,但背后还有很多的问题和痛点。第一个问题,AR的内容生产艰难,设计师必须借助专业的软件才能生产。第二,AR的应用开发门槛非常高。因为AR应用开发需要依赖一些非常呃难的能能力,比如说定位,渲染以及交互等等。
二、XR实验室的两大平台
为了帮助行业去解决这两个问题,XR实验室今年重点去打造了两个平台。第一个平台是空间编辑平台。当我们戴上AR眼镜以后,我们会在里面看到很多的虚拟内容,让用户能够很轻易的可视化的去创造这些AR内容,第二个平台是软件开发平台,我们将AR需要的核心能力以标准的SDK或者API的方式向开发者输出,让开发者轻易地创建AI应用。
为了在空间编辑平台实现这些功能。我们在创作端,自主研发了一个”万花筒”的设备。它能够让我们以低成本,高效率地采集空间地图并且自动化生成一个商业模型。除此之外,我们有基本覆盖全国的拍摄服务商网络,。可以支持全国任意地方的上门阅读采集。在存储端,我们主要利用了阿里云的服务器能力。通过负载均衡的设计来降低存储和服务调用的成本。但最核心的还是空间编辑器。当我们有了空间地图,数字内容以后,我们可以在空间编辑器里可视化的将内容和地图进行绑定。
第二个是云端定位的能力。当我们戴上AR眼镜以后,可以根据AR眼镜摄像头所捕捉的画面,实时地分析出你当前所在的位置。我们的全国采集网络能够很低成本,高效率地去完成三维地图采集。利用阿里云服务器做整体的负载均衡设计降低服务的调用成本。
三个产品是云端识别,当我们能够定位到你的位置,我们能知道当前AI看到了的内容之后,接下来我们就需要在这里叠加一些虚拟的内容。这里主要用到了环境分割,物体识别和动态识别的能力。环境分割是检测图像中色彩边缘,并结合语义库分割出物体和人物。物体识别是检测图像中的物体,现在我们可识别90类物体,适用于大部分的物体识别。动态识别是检测出手势、肢体行为等动态,并默予一定的语义,从而实现交互。
第四个能力是云端渲染,随着5G网络的普及,我们希望把渲染工作放到云端就完成,最后推送到终端显示。这样就可以极大的降低,我们对终端资源的依赖。
三、诠视科技公司简介
诠视科技于2016年创立于硅谷,2017年落地上海,在中国、美国和欧洲分别设有研发中心,研发人员占比超90%。我们是以感知交互技术为核心的AR/MR整体解决方案提供商。提供VSLAM算法、算法的硬件部署、AR整体方案以及面向
场景的应用SDK开发与定制。
我们专注于提供高质量感知交互体验整体解决方案。我们专注的领域主要有感知交互端处理平台系统解决方案,面向AR/MR设备的感知交互整体解决方案,面向机器人的交互体验解决方案。
针对上述的三个专注领域,我们也提供三类产品和服务。第一,XR/机器人感知交互核心模组。第二,全光学系列XR整机ODM。第三,面向行业的XR独立品牌产品。
我们的核心竞争力主要是三大块。即SLAM+AL底层算法,VPU/DSP硬件部署和应用SDK+系统优化。其中SLAM+AL底层算法在业界领先,slam的精度可以达到毫米级别。
我们的核心和亮点主要有两部分。第一,我们AR仿真设计的SDK。基于我们相关的技术能力,硬件平台,我们会给合作伙伴和开发者提供我们的SDK,它可以提供,云计算,各种交互方式,三维重建,高精度的slam虚实等能力。区别于当前传统的一体化设计,我们打造了一个单独的AR感知层。在我们眼镜的端侧的数据,可以通过AR感知层做实时的计算处理和分析。综上所述,我们的架构整体非常灵活。它可以适配不同品牌,不同系列的主控的单元。我们的架构支持主控单元的能力上云,从而灵活提供更强的算力和能力。
我们产品的落地,主要围绕我们的五大引擎和三大能力。三大能力分别是感知,认知和交互。五大引擎分别是我们自研的AI引擎,VSLAM引擎,深度引擎,交互引擎以及音视频引擎。我们的交互的引擎目前主要是支持手势和眼控两种。除了传统的基于AI的语义识别和理解的手势识别,我们新的产品也支持基于深度手势识别的,交互方式和交互操作。目前,我们的方案主要落地的行业集中在文旅行业,教育行业,医疗和工业制造的相关行业,都有比较多的应用和需求落地。
四、SlimEdge XR的应用场景
接下来,讲一下我们和阿里合作的应用场景。在云定位与导航方面,阿里提供相关场景扫描和云端箭头的能力。我们通过RGB圈像捕获个VIO计算,进行空间标注,地图建模。
阿里云通过云蝴GPU集群算力,渲染高精度复杂三维模型、数字李生城市基座、光场采集重建模型、容积摄影拍摄模型等内容,将渲染好的模型通过网络传输到眼镜端。眼镜端通过5G网络接收云端渲染的高精度模型内容,在保证模型面数、模型精度、纹理贴图到高规格高体验下,还能提供更长的续航、更低的发热和更轻的眼镜重量。
在远程协助和专家指导方面,随着人力成本的逐年上升和疫情影响,专家到现场指导工作的成本会越来越高。目前我们测算差旅的成本大概占到整个指导成本的50%以上。通过我们的远程协助,让专家在远端操作,现场的操作端的戴上AR眼镜,就可以实时通过音视频通讯与远程专家指导。目前,我们也和阿里做深度合作,把业务测的相关部署放在阿里云上,通过我们的传感器和数据,把远端专家基于三维的实时标注信息,传输到眼镜端。让操作者真实地看到虚拟物体标注在真实世界的场景。
在教育领域,我们首次将6DOF交互能力与爱普生光学方案有机结合,实现了3D空间的虚实结合与沉浸感升级。用户可通过姿态、手势及语音等方式进行交互。支持4G/5G,易扩展、轻量化、长续航,多平台适用。该方案适用于职业教育、数字化智慧教室、模拟培训、AR模型展示。在文旅场景,Xvisio具有6DOF功能的AR眼镜,为欢乐谷万圣节活动提供了前所未有的娱乐交互体验,兼具轻量化和长续航的特点让AR体验身临其境。
在医疗行业,Xvisio独特的VSLAM技术和6Dof感知交互方案,实现1毫米以内的高精度虚实叠加,利用AR眼镜实现即时高精度交互手术导航,赋予临床手术医生一双透视眼。该方案可适用于手术导航、医疗场景模拟培训、创新的协作医疗系统、可视化诊疗展示方案、AR助视等。
五、现当代艺术史概览
艺术这个词一直没有一个很明确的定义,我们通过两幅作品来看一下。第一件作品“泉”,号称现代艺术之父杜尚在1917年创作的。这个作品也被称为20世纪最伟大的艺术品。杜尚通过这个作品提出了一个问题,艺术是什么?杜尚认为我们生活日常所见的一切之物都可以是艺术。其实没有艺术,只有艺术家。杜尚打破了艺术和非艺术的边界,他把艺术通过这件作品向自由致敬。其实,这个作品这个小便池是因为杜尚的思想而伟大。
第二件作品是意大利的国宝级艺术家卢奇奥丰塔纳的作品,这也是他最成功的一系列作品,叫做割破系列。这个作品创造于20世纪的50年代,在那个期间毕加索的立体主义,马蒂斯野兽派已经开始影响世界,所以卢西奥另辟蹊径,把一个铺满颜料的画布用刀割了几道。让这个绘画直接突破了平面属性,所以我们经常说卢西奥的作品把绘画从一维空间带入到了1.5维的空间。他把绘画从平面中解放出来。
六、XR与艺术结合实例
接下来,我们结合几件艺术品来看一下艺术与XR结合发展的一个历程。这是兰登国际艺术团队创作的“雨屋”。这个作品在一个100平米的封闭空间里,空间里面比较昏暗,观众可以进去自由地走动体验被淋湿的感觉。这个观这个作品其实是给观众第一次带来了一种全新的互动式的沉浸式的体验
第二件作品是日本设计团队设计的”花舞森林”。”花舞森林”其实是通过电脑编程,传感器,3D技术,动画,音乐等媒介元素,把一个像花海的自然搬进了美术馆里。但是这个自然是一个超越性存在的自然,因为它比真实存在的世界更绚丽。
XR为艺术家的创作提供了更多媒介,技术支持,以及更多作品的呈现方式。,现在我们经常看到中央美院成立了实验艺术学院,清华大学也成立了信息处理设计系,为艺术和XR的结合在技术上提供了一些支持和理论研究方的保证。
从这件作品可以看到梵高和他的作品被复制到了一个虚拟空间。这个作品通过XR的技术手段,把梵高的作品从线下转移到了线上,让作品脱离画布,让作品在一个立体的虚拟场景里面体现出来。这种创造应用了XR的技术手段和复制能力,更能体现XR在艺术创作中的中介作用。
这件作品是来自中央美术学院实验艺术学院曹斐老师的作品,叫做”人民城寨”。”人民城寨”通过一些虚拟现实,包括戏剧,音乐等多种媒介用了超现实主义的表现手法,展现的是在全球化浪潮下,中国社会发展的时代变迁。曹老师的作品已经从媒介视角转移到了媒介本身,XR既是一种技术手段,又是一种表现形式。集合社交网络,虚拟现实等媒介属性,让他本身成为一种艺术形式存在。
这件作品是艺术家武子杨和阿里云设计团队合作的叫”互联生态”。这个作品是结合AR技术的二次创作,完成了实时生态模拟系统到互动的体验进化。这个作品在创作的思想和意义方面有更深层的含义,它强调的是物与物的关系和人与物的关系。这个作品从视角到意识,从意识的身体,从身体到对环境的感知,在通过感知的开放,让XR和艺术的结合变成能够正视人存在的现实意义的一条路径。
七、科技成就未来
最后,我们做一个总结。科技成就未来,XR在影响我们传统认识艺术的途径和方式。科学技术带给我们的是认知范围的拓展和深入的探索。艺术关注人的表达,常常是人的延伸。通过XR技术,艺术正在不断的扩大影响,我们也期待未来会有更多的艺术和XR结合来推动我们对艺术更高层次的感知。