硬纪元AI峰会实录|华捷艾米沈瑄:端加云才是AI和AR的未来

简介:

关于人机交互,关于AI和AR的未来,我们应该如何看待?

2017年7月9日,由镁客网、振威集团联合主办的“3E‘硬纪元’AI+产业应用创新峰会”在北京国家会议中心盛大开幕。现场200位来自全球AI行业的顶级专家、知名创投机构、创业公司团队和知名媒体齐聚一堂,共谋AI+行业的创新应用,探讨AI的当下与未来。

硬纪元AI峰会实录|华捷艾米沈瑄:端加云才是AI和AR的未来

现场,华捷艾米联合创始人沈瑄给我们带来了主题为“3D视觉系统——打造AR&AI生态”的内容分享。沈瑄表示,未来的人机交互一定是回归到人与人之间交流的本质,即视觉+语音的交互,如此才能相互理解,继而进行充分的交流。此外,关于未来数据应用的方式,在沈瑄看来,无论是AI还是AR,端加云才是真正的未来。

以下为演讲实录(为方便阅读,有所删减):

大家下午好,我是南京华捷艾米的沈瑄,刚才前几位嘉宾已经给大家分享了非常多的干货,其实人工智能的概念非常的广阔,而我们只是参与了其中的一部分:机器视觉。对于机器视觉这个概念我们也觉得非常的大,从这个车牌的识别到人脸的识别,这都是属于机器视觉,而我们做的是一个3D的一个视觉。

未来的人机交互是视觉+语音

我们说一下人机交互,尤其是人与机器人的交互。包括成人和小孩在内,其实我们大家都有一个机器人梦,从星球大战到钢铁侠,从变形金刚到阿童木,到大白,到哆啦A梦,我们都希望身边有一个机器人可以在生活、学习或者工作中去帮我们解决各种各样的问题。这就需要说到人与机器是怎么交互的。

这就是人与机器交互的一个历史。在50年代,我们通过键盘产生人与人、人与机器的交互,在下一阶段有了windows,我们通过鼠标人与机器去交互,而在2000年左右的时候,苹果的iPhone出来了,我们通过touch、通过触摸即可实现人与机器的交互。

我们说现在再下一代人与机器是怎样去交互?是视觉加语音,回到人与人之间沟通的本质。比如说我现在跟大家在交流,通过我的脸部、手势,通过我的肢体语言,大家能互相理解,去充分的交流。人机以“自然语言”的方式交互,包括语音交互、语音沟通作为基础,还包括人脸、图像、手势、虹膜、体感等等。

无论是AI还是AR,端加云才是未来真正的解决方案

然后我介绍一下我们公司在3D、AR上面的一些工作。我们公司认为,AR是人工智能在下一阶段能够应用的一个比较好的行业。苹果CEO库克也说过,AR具有无限的想象空间,它打破了虚拟世界与真实世界的一个界限,是下一代人与机器交互的一个新的模式。

我们认为AR的体系应该分成三个步骤去实现:第一是基础技术,包括3D的实时测量、V-slam、人体动作识别和手势识别等等,这些基本的一些活动的元素;到了第二代会具备一些娱乐性的要素,包括换脸、3D美颜等;最后一步则是会实现真正智能化的AR的系统,那可以通过身高、体型、年龄、性别甚至情绪的识别、通过深度学习以及物联网等各种新的技术来达到最终的一个智能化AR系统。

我们现在的芯片是把所有的数据放在里面,主要是在端这边来识别跟计算,而在未来,我们会把云端去打通,也是基于思科在2015年提出的雾计算或者是边缘化计算的这种理想。现在的移动化设备人人都有,全球可能有20亿部手机,到了一定阶段,这个数量会乘以至少7到8倍,也就意味着有140亿到150亿的终端要连接到云端,而其中所需的传输能力跟计算能力是现在的基础架构所实现不了的。思科在15年的时候提出了这个雾计算,就是在IOT的智能终端上把更多的计算,尤其是前端的一些计算放在端的芯片里,然后实时去上传一些预处理以后的数据,而从云端下载下来的是更新过的通过深度计算更新过的一些算法的模型。

所以我们认为,无论是人工智能还是AR,端加云才是未来真正的解决方案,通过终端上传数据到云下载数据,这种简单的模式肯定是远远不够的。


原文发布时间: 2017-07-18 17:19
本文作者: 韩璐
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关文章
|
人工智能 架构师 关系型数据库
第二届固件技术峰会盛大召开,共探 AI 时代固件创新之路
阿里云联合字节跳动、固件联盟主办的第二届固件技术峰会在长沙顺利召开,探索AI时代固件技术发展新趋势。
|
11月前
|
人工智能 算法 安全
AR眼镜在工业AI大模型识别的使用流程​
AR眼镜融合AI大模型,实现工业场景智能识别与预警,提升制造质量与安全。通过多模态模型适配、开源模型选型、端云协同部署及定向训练,打造高精度工业AI识别系统,助力制造业智能化升级。
|
数据采集 人工智能 大数据
演讲实录:中小企业如何快速构建AI应用?
AI时代飞速发展,大模型和AI的应用创新不断涌现,面对百花齐放的AI模型,阿里云计算平台大数据AI解决方案总监魏博文分享如何通过阿里云提供的大数据AI一体化平台,解决企业开发难、部署繁、成本高等一系列问题,让中小企业快速搭建AI应用。
|
人工智能 自然语言处理 语音技术
创新场景丨下一个iPhone 时刻,AI+AR 加速虚实融合世界的到来
仅仅以大模型通用能力帮助 AR 眼镜实现了多个场景下的交互还不够,关键在于大模型没有针对 AR 眼镜的需求做深度的定制和匹配。
|
8月前
|
传感器 人工智能 数据可视化
AI 驱动的 AR眼镜巡检技术方案:让工业缺陷识别更精准高效|阿法龙XR云平台​
针对电力、化工、制造等高风险场景,传统人工巡检效率低、漏检率高。我们推出AI+AR智能巡检方案,集成高清视觉与多传感器数据,采用轻量化YOLOv8-Nano和ResNet50模型实现缺陷实时检测与分级,结合ORB-SLAM3空间定位,在AR眼镜中精准叠加缺陷标注,识别准确率超95%,效率提升50%以上,助力巡检智能化、可视化、可追溯。
|
11月前
|
传感器 数据采集 人工智能
AR眼镜与AI视觉大模型,开启AR工业巡检与维护全新体验
AR眼镜与AI视觉大模型深度融合,革新工业设备巡检方式。实时采集数据、智能分析预警,提升巡检效率与准确性,保障工业生产安全高效运行。
AR眼镜与AI视觉大模型,开启AR工业巡检与维护全新体验
|
11月前
|
人工智能 BI 语音技术
AR眼镜+AI大模型:颠覆工业设备验收流程的智能革命
本方案结合AR眼镜与AI视觉大模型,打造高效、精准、可追溯的设备验收流程。通过第一视角记录、智能识别、结构化数据生成与智能报表功能,提升验收效率与质量,助力企业实现智能化管理。
|
存储 人工智能 Cloud Native
【发布实录】云原生+AI,助力企业全球化业务创新
本文介绍了阿里云在云原生与AI结合领域的最新产品发布和技术创新。首先,通过弹性智能的一体化架构,阿里云为AI场景提供了开箱即用的云原生能力,助力企业出海。其次,详细解析了云原生如何助力AI应用构建,包括Function AI平台、GPU极速模式、MCP Server开发托管及AI网关等核心功能。
|
人工智能 城市大脑 运维
2025数字中国建设峰会:阿里云+AI深入千行百业
近日,第八届数字中国建设峰会在福州召开。峰会期间,阿里云及通义大模型服务政企的一批领先成果被重点展示。
1130 1
|
人工智能 运维 安全
阿里云研发副总裁蔡德忠受邀参加乌镇峰会,畅谈AI与下一代互联网
2024年乌镇峰会“下一代互联网论坛”近日举办,主题为“创新驱动,安全赋能,共筑开放与安全的下一代互联网”。阿里云智能集团研发副总裁,基础设施网络研发负责人蔡德忠受邀参与圆桌讨论,并就人工智能(AI)与下一代互联网的融合发展分享了前瞻性见解。