虚实交映:智能机器人实践

简介: 本篇内容分享了虚实交映:智能机器人实践。

分享人:

谭  雄 阿里巴巴达摩院XR实验室AR产品负责人

孙元科 上海诠视传感技术有限公司解决方案总监

李克非 松美术馆运营负责人

正文:

本篇内容将通过个部分来介绍虚实交映:智能机器人实践。

一、AR行业的瓶颈与痛点

二、XR实验室的两大平台

三、诠视科技公司简介

四、SlimEdge XR的应用场景

五、现当代艺术史概览

六、XR与艺术结合实例

七、科技成就未来

 

image.png

一、AR行业的瓶颈与痛点

虽然AR行业风风火火,背后还有很多的问题和痛点第一个问题,AR的内容生产艰难,设计师必须借助专业的软件才能生产。第二,AR的应用开发门槛非常高因为AR应用开发需要依赖一些非常呃难能能力,比如说定位,渲染以及交互等等。

image.png

二、XR实验室的两大平台

为了帮助行业去解决这两个问题,XR实验室今年重点去打造了两个平台第一个平台是空间编辑平台当我们戴上AR眼镜以后,我们会在里面看到很多的虚拟内容,让用户能够很轻易的可视化的去创造这些AR内容,第二个平台是软件开发平台,我将AR需要的核心能力标准的SDK或者API的方式向开发者输出,让开发者轻易地创建AI应用。

image.png

为了在空间编辑平台实现这些功能我们在创作端,自主研发一个”万花筒的设备。能够让我们低成本,高效率地采集空间地图并且自动化生成一个商业模型。除此之外,我们有基本覆盖全国的拍摄服务商网络,可以支持全国任意地方的上门阅读采集在存储端,我们主要利用了阿里云的服务器能力。通过负载均衡的设计来降低存储和服务调用的成本最核心的还是空间编辑器。当我们有了空间地图,数字内容以后,我们可以在空间编辑器里可视化的将内容和地图进行绑定。

image.png

第二个是云端定位的能力。当我们戴上AR眼镜以后,可以根据AR眼镜摄像头所捕捉的画面,实时地分析出你当前所在的位置。我们全国采集网络能够很低成本,高效率地去完成三维地图采集利用阿里云服务器做整体的负载均衡设计降低服务的调用成本

image.png

三个产品是云端识别,当我们能够定位到你位置我们能知道当前AI看到了内容之后,接下来我们就需要在这里叠加一些虚拟的内容。这里主要用到了环境分割物体识别和动态识别的能力。环境分割是检测图像中色彩边缘,并结合语义库分割出物体和人物。物体识别是检测图像中的物体,现在我们可识别90类物体,适用于大部分的物体识别。动态识别是检测出手势、肢体行为等动态,并默予一定的语义,从而实现交互。

image.png

四个能力是云端渲染随着5G网络的普及,我们希望把渲染工作放到云端就完成最后推送到终端显示这样就可以极大的降低,我们对终端资源依赖

image.png

三、诠视科技公司简介

诠视科技于2016年创立于硅谷,2017年落地上海,在中国、美国和欧洲分别设有研发中心,研发人员占比超90%。我们是以感知交互技术为核心的AR/MR整体解决方案提供商。提供VSLAM算法、算法的硬件部署、AR整体方案以及面向

场景的应用SDK开发与定制。

image.png

我们专注于提供高质量感知交互体验整体解决方案。我们专注的领域主要有感知交互端处理平台系统解决方案,面向AR/MR设备的感知交互整体解决方案,面向机器人的交互体验解决方案。

image.png

针对上述的三个专注领域,我们也提供三类产品和服务。第一,XR/机器人感知交互核心模组第二,全光学系列XR整机ODM。第三,面向行业的XR独立品牌产品。

image.png

我们的核心竞争力主要是三大块SLAM+AL底层算法,VPU/DSP硬件部署和应用SDK+系统优化。其中SLAM+AL底层算法在业界领先,slam的精度可以达到毫米级别

image.png

我们的核心和亮点主要有两部分第一,我们AR仿真设计的SDK。基于我们相关的技术能力,硬件平台,我们会给合作伙伴和开发者提供我们的SDK,它可以提供,云计算,各种交互方式,三维重建高精度的slam虚实能力。区别于当前传统的一体化设计我们打造了一个单独的AR感知层在我们眼镜的端侧数据,可以通过AR感知层做实时的计算处理和分析综上所述,我们的架构整体非常灵活。它可以适配不同品牌不同系列的主控的单元。我们的架构支持主控单元的能力上云从而灵活提供更强的算力和能力

image.png

我们产品的落地,主要围绕我们的五大引擎和三大能力三大能力分别是感知认知和交互。五大引擎分别是我们自研的AI引擎,VSLAM引擎,深度引擎,交互引擎以及音视频引擎。我们的交互的引擎目前主要是支持手势和眼控两种除了传统的基于AI的语义识别和理解的手势识别,我们新的产品也支持基于深度手势识别的交互方式和交互操作。目前,我们的方案主要落地的行业集中在文旅行业,教育行业医疗和工业制造的相关行业有比较多的应用和需求落地

image.png

四、SlimEdge XR的应用场景

接下来,讲一下我们和阿里合作的应用场景在云定位与导航方面,阿里提供相关场景扫描和云端箭头的能力。我们通过RGB圈像捕获个VIO计算,进行空间标注,地图建模。

image.png

阿里云通过云蝴GPU集群算力,渲染高精度复杂三维模型、数字李生城市基座、光场采集重建模型、容积摄影拍摄模型等内容,将渲染好的模型通过网络传输到眼镜端。眼镜端通过5G网络接收云端渲染的高精度模型内容,在保证模型面数、模型精度、纹理贴图到高规格高体验下,还能提供更长的续航、更低的发热和更轻的眼镜重量。

image.png

远程协助和专家指导方面,随着人力成本的逐年上升疫情影响专家到现场指导工作的成本会越来越高目前我们测算差旅的成本大概占到整个指导成本的50%以上通过我们的远程协助,让专家远端操作,现场的操作端的戴上AR眼镜,就可以实时通过音视频通讯远程专家指导目前我们也和阿里做深度合作,把业务测的相关部署放在阿里云上,通过我们的传感器和数据远端专家基于三维的实时标注信息传输到眼镜让操作者真实地看到虚拟物体标注在真实世界的场景。

image.png

在教育领域,我们首次将6DOF交互能力与爱普生光学方案有机结合,实现了3D空间的虚实结合与沉浸感升级。用户可通过姿态、手势及语音等方式进行交互。支持4G/5G,易扩展、轻量化、长续航,多平台适用。该方案适用于职业教育、数字化智慧教室、模拟培训、AR模型展示。在文旅场景,Xvisio具有6DOF功能的AR眼镜,为欢乐谷万圣节活动提供了前所未有的娱乐交互体验,兼具轻量化和长续航的特点让AR体验身临其境。

image.png

在医疗行业,Xvisio独特的VSLAM技术和6Dof感知交互方案,实现1毫米以内的高精度虚实叠加,利用AR眼镜实现即时高精度交互手术导航,赋予临床手术医生一双透视眼。该方案可适用于手术导航、医疗场景模拟培训、创新的协作医疗系统、可视化诊疗展示方案、AR助视等。

image.png

五、现当代艺术史概览

艺术这个词一直没有一个很明确的定义,我们通过两幅作品来看一下第一件作品”,号称现代艺术之父杜尚在1917年创作的这个作品也被称为20世纪最伟大的艺术品。杜尚通过这个作品提出了一个问题,艺术是什么?杜尚认为我们生活日常所见的一切之物都可以是艺术其实没有艺术,只有艺术家杜尚打破了艺术和非艺术的边界他把艺术通过这件作品自由致敬。其实,这个作品这个小便池是因为杜尚的思想而伟大。

image.png

第二件作品是意大利的国宝级艺术家卢奇奥丰塔纳的作品,这也是他最成功的一系列作品,叫做割破系列。这个作品创造于20世纪的50年代在那个期间毕加索的立体主义马蒂斯野兽派已经开始影响世界,所以卢西奥另辟蹊径,把一个铺满颜料的画布用刀割了几道。让这个绘画直接突破了平面属性,所以我们经常说卢西奥的作品绘画从一维空间带入到了1.5维的空间他把绘画从平面中解放出来

image.png

六、XR与艺术结合实例

接下来,我们结合几件艺术品来看一下艺术与XR结合发展的一个历程。这是兰登国际艺术团队创作的“雨屋”。这个作品在一个100平米的封闭空间里空间里面比较昏暗,观众可以进去自由地走动体验被淋湿的感觉这个观这个作品其实是给观众第一次带来了一种全新的互动式的沉浸式的体验

image.png

第二件作品是日本设计团队设计的花舞森林”。”花舞森林其实是通过电脑编程传感器,3D技术,动画,音乐等媒介元素,把一个像花海的自然搬进了美术馆里但是这个自然是一个超越性存在的自然,因为它比真实存在的世界更绚丽

image.png

XR为艺术家的创作提供了更多媒介,技术支持,以及更多作品呈现方式,现在我们经常看到中央美院成立了实验艺术学院,清华大学也成立了信息处设计系,为艺术和XR的结合在技术上提供了一些支持理论研究方保证

image.png

这件作品可以看到梵高和的作品被复制到了一个虚拟空间这个作品通过XR的技术手段,把梵高的作品从线下转移到了线上,让作品脱离画布让作品在一个立体的虚拟场景里面体现出来。这种创造应用XR的技术手段和复制能力,更能体现XR在艺术创作中的中介作用。

image.png

这件作品是来自中央美术学院实验艺术学院曹斐老师的作品叫做人民城寨”。人民城寨”通过一些虚拟现实,包括戏剧,音乐等多种媒介用了超现实主义的表现手法,展现的是在全球化浪潮下,中国社会发展的时代变迁。曹老师的作品已经从媒介视角转移到了媒介本身XR既是一种技术手段,又是一种表现形式集合社交网络,虚拟现实等媒介属性,让他本身成为一种艺术形式存在

image.png

件作品是艺术家武子杨和阿里云设计团队合作的叫”互联生态。这个作品是结合AR技术的二次创作完成了实时生态模拟系统到互动的体验进化这个作品在创作的思想和意义方面有更深层的含义,强调的是物与物的关系和人与物的关系。这个作品从视角到意识,从意识的身体从身体到对环境的感知,在通过感知的开放,让XR和艺术的结合变成能够正视人存在的现实意义的一条路径。

image.png

七、科技成就未来

最后,我们做一个总结科技成就未来,XR在影响我们传统认识艺术的途径和方式。科学技术带给我们的是认知范围的拓展和深入的探索。艺术关注人的表达,常常是人的延伸。通过XR技术,艺术正在不断的扩大影响,我们也期待未来会有更多的艺术和XR结合来推动我们对艺术更高层次的感知。


相关文章
|
6月前
|
机器学习/深度学习 自然语言处理 机器人
【RAG实践】基于LlamaIndex和Qwen1.5搭建基于本地知识库的问答机器人
LLM会产生误导性的 “幻觉”,依赖的信息可能过时,处理特定知识时效率不高,缺乏专业领域的深度洞察,同时在推理能力上也有所欠缺。
|
1天前
|
自然语言处理 算法 机器人
智能电话销售机器人源码搭建部署系统电话机器人源码
智能电话销售机器人源码搭建部署系统电话机器人源码
11 4
|
12天前
|
机器学习/深度学习 传感器 算法
智能机器人在工业自动化中的应用与前景###
本文探讨了智能机器人在工业自动化领域的最新应用,包括其在制造业中的集成、操作灵活性和成本效益等方面的优势。通过分析当前技术趋势和案例研究,预测了智能机器人未来的发展方向及其对工业生产模式的潜在影响。 ###
50 9
|
4天前
|
机器学习/深度学习 人工智能 运维
电话机器人源码-智能ai系统-freeswitch-smartivr呼叫中心-crm
电话机器人源码-智能ai系统-freeswitch-smartivr呼叫中心-crm
22 0
|
8天前
|
机器人 人机交互 语音技术
智能电销机器人源码部署安装好后怎么运行
销售打电销,其中90%电销都是无效的,都是不接,不要等被浪费了这些的精力,都属于忙于筛选意向客户,大量的人工时间都耗费在此了。那么,有这种新型的科技产品,能为你替代这些基本的工作,能为你提升10倍的电销效果。人们都在关心智能语音客服机器人如何高效率工作的问题,今天就为大家简单的介绍下:1、智能筛选系统:电销机器人目前已经达到一个真人式的专家级的销售沟通水平,可以跟客户沟通,筛选意向,记录语音和文字通话记录,快速帮助电销企业筛选意向客户,大大的节约了筛选时间成本和人工成本。2、高速运转:在工作效率上,人工电销员,肯定跟不上智能语音机器人,机器人自动拨出电话,跟客户交谈。电话机
83 0
|
1月前
|
人工智能 搜索推荐 机器人
挑战未来职场:亲手打造你的AI面试官——基于Agents的模拟面试机器人究竟有多智能?
【10月更文挑战第7天】基于Agent技术,本项目构建了一个AI模拟面试机器人,旨在帮助求职者提升面试表现。通过Python、LangChain和Hugging Face的transformers库,实现了自动提问、即时反馈等功能,提供灵活、个性化的模拟面试体验。相比传统方法,AI模拟面试机器人不受时间和地点限制,能够实时提供反馈,帮助求职者更好地准备面试。
55 2
|
3月前
|
人工智能 算法 机器人
机器人版的斯坦福小镇来了,专为具身智能研究打造
【8月更文挑战第12天】《GRUtopia:城市级具身智能仿真平台》新论文发布,介绍了一款由上海AI实验室主导的大规模3D城市模拟环境——GRUtopia。此平台包含十万级互动场景与大型语言模型驱动的NPC系统,旨在解决具身智能研究中的数据稀缺问题并提供全面的评估工具,为机器人技术的进步搭建重要桥梁。https://arxiv.org/pdf/2407.10943
218 60
|
6月前
|
自然语言处理 机器人 Go
【飞书ChatGPT机器人】飞书接入ChatGPT,打造智能问答助手
【飞书ChatGPT机器人】飞书接入ChatGPT,打造智能问答助手
364 0
|
3月前
|
机器人 C# 人工智能
智能升级:WPF与人工智能的跨界合作——手把手教你集成聊天机器人,打造互动新体验与个性化服务
【8月更文挑战第31天】聊天机器人已成为现代应用的重要组成部分,提供即时响应、个性化服务及全天候支持。随着AI技术的发展,聊天机器人的功能日益强大,不仅能进行简单问答,还能实现复杂对话管理和情感分析。本文通过具体案例分析,展示了如何在WPF应用中集成聊天机器人,并通过示例代码详细说明其实现过程。使用Microsoft的Bot Framework可以轻松创建并配置聊天机器人,增强应用互动性和用户体验。首先,需在Bot Framework门户中创建机器人项目并编写逻辑。然后,在WPF应用中添加聊天界面,实现与机器人的交互。
103 0
下一篇
无影云桌面