打破虚拟边界的视频交互新方式,AR隔空书写的应用理念和探索实践

简介: 手势交互的新方式,会是下一个爆款应用吗?

ezgif.com-gif-maker (8).gif

AR隔空书写演示


随着技术的发展和超视频化的时代驱动,交互的形式日渐丰富。从屏幕点触,到语音交互,人脸、指纹、声纹,再到近年流行的AR和VR……人类早在语言出现之前便习惯使用肢体和手势这种近乎本能的沟通方式来进行交流,作为最基础和自然的交互方式,手势交互的应用场景越来越多。

 

当前,市面上大部分视频应用的手势交互逻辑,主要是通过某个具体手势触发预置的单个特效,这种较为简单的交互不仅不能发挥出人类灵活手掌的潜力,在终端上的识别效果也有较大的提升空间。

 

尤其是受疫情影响以及在音视频会议和协同办公需求巨大的今天,使用实体白板画图写字进行远程沟通和协作非常困难。


虽然市面上有类似虚拟白板的产品,但是这类产品主要还是依赖于鼠标等设备来进行输入,我们可以利用手势的天然优势,代替鼠标、键盘、触屏等交互方式,实现AR隔空书写,在办公、生活、娱乐场景发挥其巨大价值。


AR隔空书写,打破虚拟白板壁垒

如何通过AR隔空书写来实现一个完善的虚拟白板?


最直接的想法是把写字的内容渲染在屏幕上,例如最近一个较火的开源项目“Yoha”便是通过这个想法实现了效果,但这也面临着因为摄像头视角有限导致字无法写得很小和书写内容有限等问题。

ezgif.com-gif-maker (9).gif

另一种方案,可以通过先书写一部分内容,将其缩小后,再写另一部分内容。这种解决方案看似可行,却面临着排版困难以及前后内容连续性差等问题。

 

阿里云视频云美颜特效SDK(以下简称“美效SDK”)的AR隔空书写能力,通过把AR隔空书写的窗口悬浮在虚拟白板上,使得AR隔空书写窗口可以自由的放大、缩小、平移,这样用户就可以自由控制写字的大小和位置,对书写内容的排版也会更具操控性。

3.png

对于摄像头捕捉的每一帧图像的边缘进行裁剪,然后再悬浮在白板上,用户可以放大或缩小ROI窗口,来实现对书写内容的大小和精细度的控制。

ezgif.com-gif-maker (10).gif

用户还可以通过移动AR隔空书写窗口来控制写字的位置。

5的副本.gif

当使用者的手势(虚拟笔尖)移到AR窗口边缘附近的时候,AR窗口将会自动朝对应的方向移动(参考DOTA、LOL、魔兽争霸等游戏移动窗口)。


参考动图,这种身体不需要移动的操作方式不仅符合人的书写使用习惯,也使得移动窗口的便利性和使用舒适性大大提高。

6的副本.gif

阿里云视频云将该AR隔空书写能力作为“隐藏黑科技”集成在钉钉的音视频会议硬件产品中,该能力可以帮助参会者在远程会议中通过隔空书写或是画图来助力沟通。在近期的钉钉发布会上,阿里云视频云也对该能力进行了交互展示。

钉钉2022线上发布会,AR隔空书写现场演示

 

丰富虚拟特效,让视频交互更趣意

AR隔空书写还可以和粒子特效结合,展现出雪花、火焰、水滴、花瓣、烟雾等各类丰富炫酷的特效,为用户进行个性创作提供发挥空间,让视频交互更美感、更有趣。

ezgif.com-gif-maker (8)的副本.gifezgif.com-gif-maker (8)的副本2.gif

AR隔空书写能力近日上线于阿里云视频云的美效SDK,这是基于自研的面部关键点位技术,支持画面美化、人像美颜、抠像制作、贴纸美妆、动作识别、智趣交互、抠像处理等多种个性化的定制美效交互服务。

 

美效SDK具备多维度优势:


  • 效果好:功能全面、一键组合与逐项DIY
  • 包体小:基础美颜功能仅需0.78M
  • 性能优:Android最低支持4.3系统,iOS系统最低支持到iOS-8系统,Mac支持最新M1
  • 接入快速可定制:独立组装拆解、按需参数级调整定制

 

基于一系列的应用优势,美效SDK适用于直播、拍摄、会议、电商等多种业务场景,完美平衡了效果美化与性能开销的问题,助力视频交互更丰富智趣。

 

可以预见的是,手势交互是未来人机交互必不可少的一部分,一个轻盈无边界的沉浸式虚拟世界,不可能完全依赖“手持设备”和实体的“触点交互”,用技术解放双手才是虚拟与现实无缝链接的正确打开方式。


视频化场景的交互瓶颈已初显,阿里云视频云基于美效SDK的AR隔空书写能力的研发与应用,为超视频化时代的智趣新交互提供了更多可能,推动视频交互走向更远。


想体验AR隔空书写Demo或者交流的读者欢迎钉钉搜索群号:34197869,或扫下方二维码加入

image.png


「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。公众号后台回复【技术】可加入阿里云视频云产品技术交流群,和业内大咖一起探讨音视频技术,获取更多行业最新信息。

相关文章
|
4月前
|
数据采集 运维 数据可视化
AR 运维系统与 MES、EMA、IoT 系统的融合架构与实践
AR运维系统融合IoT、EMA、MES数据,构建“感知-分析-决策-执行”闭环。通过AR终端实现设备数据可视化,实时呈现温度、工单等信息,提升运维效率与生产可靠性。(238字)
|
5月前
|
传感器 运维 数据可视化
AR眼镜巡检系统在工业互联网的应用:AR+IoT
AR与IoT融合构建虚实闭环,IoT采集实时数据,AR直观呈现并交互,形成感知-分析-决策-行动高效闭环,提升运维效率。
|
3月前
|
传感器 机器学习/深度学习 算法
【征文计划】从技术框架到源码落地,看懂Rokid 手势识别及AR眼镜自然交互的核心
从技术框架到源码落地,看懂Rokid 手势识别及AR眼镜自然交互的核心
|
6月前
|
安全 vr&ar
降本增效神器:AR眼镜远程协助在数字化工业的应用
AR眼镜助力工业维修,实现远程实时协助,提升效率,降低成本,推动工业智能化发展。
|
4月前
|
传感器 人工智能 安全
AR 巡检在工业的应用|阿法龙XR云平台
AR巡检技术广泛应用于电力、石化、制造、交通等行业,通过AR眼镜或平板实时叠加设备参数、历史数据及操作指引,提升巡检效率与准确性。支持远程协作、自动记录分析,并可在高危环境实现无人巡检,大幅降低安全风险,推动智能化运维升级。
|
4月前
|
机器学习/深度学习 人工智能 vr&ar
H4H:面向AR/VR应用的NPU-CIM异构系统混合卷积-Transformer架构搜索——论文阅读
H4H是一种面向AR/VR应用的混合卷积-Transformer架构,基于NPU-CIM异构系统,通过神经架构搜索实现高效模型设计。该架构结合卷积神经网络(CNN)的局部特征提取与视觉Transformer(ViT)的全局信息处理能力,提升模型性能与效率。通过两阶段增量训练策略,缓解混合模型训练中的梯度冲突问题,并利用异构计算资源优化推理延迟与能耗。实验表明,H4H在相同准确率下显著降低延迟和功耗,为AR/VR设备上的边缘AI推理提供了高效解决方案。
528 0
|
4月前
|
人工智能 监控 大数据
AR眼镜在警务安防的应用方案
针对当前社会治安防控难题,基于阿法龙XR云平台打造的云眼AI警务模块,融合AR与AI技术,构建“感知-分析-指挥-执行”一体化防控体系。通过AR智能眼镜实现人脸识别、车牌识别、人证比对、远程调度、执法记录等功能,提升执法效率与智能化水平,助力警务模式转型升级。
|
6月前
|
传感器 自然语言处理 资源调度
AR 交互与自动感应技术的博物馆智慧导览系统功能解析
本系统结合AR图像识别、自动感应与多语言资源管理,实现虚拟内容与文物精准叠加、自动讲解与智能导航,提升博物馆导览体验智能化、互动性。
584 1
|
5月前
|
运维 数据可视化 vr&ar
AR远程协作在发电领域的运维应用方案
发电厂面临设备故障频发、运维人员经验不足、远程支持困难及维护成本高昂等挑战。为提升运维效率与设备可靠性,越来越多电厂开始采用增强现实(AR)远程协作技术。通过AR设备,现场人员可与远程专家实时协作,实现快速故障诊断与修复、可视化操作指导和精准培训支持。AR技术不仅缩短停机时间,降低运维成本,还提升了应急响应能力与决策效率,助力发电行业向智能化、高效化方向发展。
|
安全 vr&ar 计算机视觉
AR智能眼镜在警务安防的人脸识别场景,有哪些应用和优势?
AR智能眼镜结合人脸识别技术,为安防领域带来高效精准的解决方案。通过实时采集与分析人脸信息,快速识别重点人员并即时报警,广泛应用于机场、车站、大型活动等场景,显著提升安全防控能力。
AR智能眼镜在警务安防的人脸识别场景,有哪些应用和优势?

热门文章

最新文章