虚实交映:智能机器人实践

简介: 本篇内容分享了虚实交映:智能机器人实践。

分享人:

谭  雄 阿里巴巴达摩院XR实验室AR产品负责人

孙元科 上海诠视传感技术有限公司解决方案总监

李克非 松美术馆运营负责人

正文:

本篇内容将通过个部分来介绍虚实交映:智能机器人实践。

一、AR行业的瓶颈与痛点

二、XR实验室的两大平台

三、诠视科技公司简介

四、SlimEdge XR的应用场景

五、现当代艺术史概览

六、XR与艺术结合实例

七、科技成就未来

 

image.png

一、AR行业的瓶颈与痛点

虽然AR行业风风火火,背后还有很多的问题和痛点第一个问题,AR的内容生产艰难,设计师必须借助专业的软件才能生产。第二,AR的应用开发门槛非常高因为AR应用开发需要依赖一些非常呃难能能力,比如说定位,渲染以及交互等等。

image.png

二、XR实验室的两大平台

为了帮助行业去解决这两个问题,XR实验室今年重点去打造了两个平台第一个平台是空间编辑平台当我们戴上AR眼镜以后,我们会在里面看到很多的虚拟内容,让用户能够很轻易的可视化的去创造这些AR内容,第二个平台是软件开发平台,我将AR需要的核心能力标准的SDK或者API的方式向开发者输出,让开发者轻易地创建AI应用。

image.png

为了在空间编辑平台实现这些功能我们在创作端,自主研发一个”万花筒的设备。能够让我们低成本,高效率地采集空间地图并且自动化生成一个商业模型。除此之外,我们有基本覆盖全国的拍摄服务商网络,可以支持全国任意地方的上门阅读采集在存储端,我们主要利用了阿里云的服务器能力。通过负载均衡的设计来降低存储和服务调用的成本最核心的还是空间编辑器。当我们有了空间地图,数字内容以后,我们可以在空间编辑器里可视化的将内容和地图进行绑定。

image.png

第二个是云端定位的能力。当我们戴上AR眼镜以后,可以根据AR眼镜摄像头所捕捉的画面,实时地分析出你当前所在的位置。我们全国采集网络能够很低成本,高效率地去完成三维地图采集利用阿里云服务器做整体的负载均衡设计降低服务的调用成本

image.png

三个产品是云端识别,当我们能够定位到你位置我们能知道当前AI看到了内容之后,接下来我们就需要在这里叠加一些虚拟的内容。这里主要用到了环境分割物体识别和动态识别的能力。环境分割是检测图像中色彩边缘,并结合语义库分割出物体和人物。物体识别是检测图像中的物体,现在我们可识别90类物体,适用于大部分的物体识别。动态识别是检测出手势、肢体行为等动态,并默予一定的语义,从而实现交互。

image.png

四个能力是云端渲染随着5G网络的普及,我们希望把渲染工作放到云端就完成最后推送到终端显示这样就可以极大的降低,我们对终端资源依赖

image.png

三、诠视科技公司简介

诠视科技于2016年创立于硅谷,2017年落地上海,在中国、美国和欧洲分别设有研发中心,研发人员占比超90%。我们是以感知交互技术为核心的AR/MR整体解决方案提供商。提供VSLAM算法、算法的硬件部署、AR整体方案以及面向

场景的应用SDK开发与定制。

image.png

我们专注于提供高质量感知交互体验整体解决方案。我们专注的领域主要有感知交互端处理平台系统解决方案,面向AR/MR设备的感知交互整体解决方案,面向机器人的交互体验解决方案。

image.png

针对上述的三个专注领域,我们也提供三类产品和服务。第一,XR/机器人感知交互核心模组第二,全光学系列XR整机ODM。第三,面向行业的XR独立品牌产品。

image.png

我们的核心竞争力主要是三大块SLAM+AL底层算法,VPU/DSP硬件部署和应用SDK+系统优化。其中SLAM+AL底层算法在业界领先,slam的精度可以达到毫米级别

image.png

我们的核心和亮点主要有两部分第一,我们AR仿真设计的SDK。基于我们相关的技术能力,硬件平台,我们会给合作伙伴和开发者提供我们的SDK,它可以提供,云计算,各种交互方式,三维重建高精度的slam虚实能力。区别于当前传统的一体化设计我们打造了一个单独的AR感知层在我们眼镜的端侧数据,可以通过AR感知层做实时的计算处理和分析综上所述,我们的架构整体非常灵活。它可以适配不同品牌不同系列的主控的单元。我们的架构支持主控单元的能力上云从而灵活提供更强的算力和能力

image.png

我们产品的落地,主要围绕我们的五大引擎和三大能力三大能力分别是感知认知和交互。五大引擎分别是我们自研的AI引擎,VSLAM引擎,深度引擎,交互引擎以及音视频引擎。我们的交互的引擎目前主要是支持手势和眼控两种除了传统的基于AI的语义识别和理解的手势识别,我们新的产品也支持基于深度手势识别的交互方式和交互操作。目前,我们的方案主要落地的行业集中在文旅行业,教育行业医疗和工业制造的相关行业有比较多的应用和需求落地

image.png

四、SlimEdge XR的应用场景

接下来,讲一下我们和阿里合作的应用场景在云定位与导航方面,阿里提供相关场景扫描和云端箭头的能力。我们通过RGB圈像捕获个VIO计算,进行空间标注,地图建模。

image.png

阿里云通过云蝴GPU集群算力,渲染高精度复杂三维模型、数字李生城市基座、光场采集重建模型、容积摄影拍摄模型等内容,将渲染好的模型通过网络传输到眼镜端。眼镜端通过5G网络接收云端渲染的高精度模型内容,在保证模型面数、模型精度、纹理贴图到高规格高体验下,还能提供更长的续航、更低的发热和更轻的眼镜重量。

image.png

远程协助和专家指导方面,随着人力成本的逐年上升疫情影响专家到现场指导工作的成本会越来越高目前我们测算差旅的成本大概占到整个指导成本的50%以上通过我们的远程协助,让专家远端操作,现场的操作端的戴上AR眼镜,就可以实时通过音视频通讯远程专家指导目前我们也和阿里做深度合作,把业务测的相关部署放在阿里云上,通过我们的传感器和数据远端专家基于三维的实时标注信息传输到眼镜让操作者真实地看到虚拟物体标注在真实世界的场景。

image.png

在教育领域,我们首次将6DOF交互能力与爱普生光学方案有机结合,实现了3D空间的虚实结合与沉浸感升级。用户可通过姿态、手势及语音等方式进行交互。支持4G/5G,易扩展、轻量化、长续航,多平台适用。该方案适用于职业教育、数字化智慧教室、模拟培训、AR模型展示。在文旅场景,Xvisio具有6DOF功能的AR眼镜,为欢乐谷万圣节活动提供了前所未有的娱乐交互体验,兼具轻量化和长续航的特点让AR体验身临其境。

image.png

在医疗行业,Xvisio独特的VSLAM技术和6Dof感知交互方案,实现1毫米以内的高精度虚实叠加,利用AR眼镜实现即时高精度交互手术导航,赋予临床手术医生一双透视眼。该方案可适用于手术导航、医疗场景模拟培训、创新的协作医疗系统、可视化诊疗展示方案、AR助视等。

image.png

五、现当代艺术史概览

艺术这个词一直没有一个很明确的定义,我们通过两幅作品来看一下第一件作品”,号称现代艺术之父杜尚在1917年创作的这个作品也被称为20世纪最伟大的艺术品。杜尚通过这个作品提出了一个问题,艺术是什么?杜尚认为我们生活日常所见的一切之物都可以是艺术其实没有艺术,只有艺术家杜尚打破了艺术和非艺术的边界他把艺术通过这件作品自由致敬。其实,这个作品这个小便池是因为杜尚的思想而伟大。

image.png

第二件作品是意大利的国宝级艺术家卢奇奥丰塔纳的作品,这也是他最成功的一系列作品,叫做割破系列。这个作品创造于20世纪的50年代在那个期间毕加索的立体主义马蒂斯野兽派已经开始影响世界,所以卢西奥另辟蹊径,把一个铺满颜料的画布用刀割了几道。让这个绘画直接突破了平面属性,所以我们经常说卢西奥的作品绘画从一维空间带入到了1.5维的空间他把绘画从平面中解放出来

image.png

六、XR与艺术结合实例

接下来,我们结合几件艺术品来看一下艺术与XR结合发展的一个历程。这是兰登国际艺术团队创作的“雨屋”。这个作品在一个100平米的封闭空间里空间里面比较昏暗,观众可以进去自由地走动体验被淋湿的感觉这个观这个作品其实是给观众第一次带来了一种全新的互动式的沉浸式的体验

image.png

第二件作品是日本设计团队设计的花舞森林”。”花舞森林其实是通过电脑编程传感器,3D技术,动画,音乐等媒介元素,把一个像花海的自然搬进了美术馆里但是这个自然是一个超越性存在的自然,因为它比真实存在的世界更绚丽

image.png

XR为艺术家的创作提供了更多媒介,技术支持,以及更多作品呈现方式,现在我们经常看到中央美院成立了实验艺术学院,清华大学也成立了信息处设计系,为艺术和XR的结合在技术上提供了一些支持理论研究方保证

image.png

这件作品可以看到梵高和的作品被复制到了一个虚拟空间这个作品通过XR的技术手段,把梵高的作品从线下转移到了线上,让作品脱离画布让作品在一个立体的虚拟场景里面体现出来。这种创造应用XR的技术手段和复制能力,更能体现XR在艺术创作中的中介作用。

image.png

这件作品是来自中央美术学院实验艺术学院曹斐老师的作品叫做人民城寨”。人民城寨”通过一些虚拟现实,包括戏剧,音乐等多种媒介用了超现实主义的表现手法,展现的是在全球化浪潮下,中国社会发展的时代变迁。曹老师的作品已经从媒介视角转移到了媒介本身XR既是一种技术手段,又是一种表现形式集合社交网络,虚拟现实等媒介属性,让他本身成为一种艺术形式存在

image.png

件作品是艺术家武子杨和阿里云设计团队合作的叫”互联生态。这个作品是结合AR技术的二次创作完成了实时生态模拟系统到互动的体验进化这个作品在创作的思想和意义方面有更深层的含义,强调的是物与物的关系和人与物的关系。这个作品从视角到意识,从意识的身体从身体到对环境的感知,在通过感知的开放,让XR和艺术的结合变成能够正视人存在的现实意义的一条路径。

image.png

七、科技成就未来

最后,我们做一个总结科技成就未来,XR在影响我们传统认识艺术的途径和方式。科学技术带给我们的是认知范围的拓展和深入的探索。艺术关注人的表达,常常是人的延伸。通过XR技术,艺术正在不断的扩大影响,我们也期待未来会有更多的艺术和XR结合来推动我们对艺术更高层次的感知。


相关文章
|
11天前
|
机器学习/深度学习 自然语言处理 机器人
【RAG实践】基于LlamaIndex和Qwen1.5搭建基于本地知识库的问答机器人
LLM会产生误导性的 “幻觉”,依赖的信息可能过时,处理特定知识时效率不高,缺乏专业领域的深度洞察,同时在推理能力上也有所欠缺。
|
11天前
|
传感器 人工智能 监控
智能耕耘机器人
智能耕耘机器人
50 3
|
7月前
|
人工智能 自然语言处理 机器人
智能电话机器人核心技术:自然语言处理
什么是自然语言处理? 自然语言处理是计算机科学领域与人工智能领域中的一个重要方向.它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法.自然语言处理是一门融语言学、计算机科学、数学于一体的科学.因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别. 自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统.因而它是计算机科学的一部分. 自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域.
|
11天前
|
自然语言处理 机器人 Go
【飞书ChatGPT机器人】飞书接入ChatGPT,打造智能问答助手
【飞书ChatGPT机器人】飞书接入ChatGPT,打造智能问答助手
|
11天前
|
网络协议 机器人 人机交互
工业机器人应用实践之玻璃涂胶(篇三)
工业机器人应用实践之玻璃涂胶(篇三)
15 2
|
11天前
|
机器人 人机交互
工业机器人应用实践之玻璃涂胶(篇二)
工业机器人应用实践之玻璃涂胶(篇二)
13 1
|
11天前
|
传感器 人工智能 网络协议
工业机器人应用实践之玻璃涂胶(篇一)
工业机器人应用实践之玻璃涂胶(篇一)
41 1
|
11天前
|
机器人 Python Windows
ROS机器人编程技术应用与实践
ROS机器人编程技术应用与实践
14 1
|
11天前
|
传感器 人工智能 自然语言处理
智能咖啡厅助手:人形机器人 +融合大模型,行为驱动的智能咖啡厅机器人
智能咖啡厅助手:人形机器人 +融合大模型,行为驱动的智能咖啡厅机器人
智能咖啡厅助手:人形机器人 +融合大模型,行为驱动的智能咖啡厅机器人
|
11天前
|
传感器 机器学习/深度学习 算法
植保机器人具备智能感知与决策能力
植保机器人具备智能感知与决策能力
22 2

热门文章

最新文章