人工智能直播表演魔术 阿里云ET双11狂欢夜秀超能力

简介:

【本文转载自中新网】

中新网11月11日电 11月10日晚,“天猫双11狂欢夜”在深圳大运中心拉开巨幕。除了汇聚全球半个娱乐圈的明星外,还有一位拥有“超能力”的神秘嘉宾登场——阿里云人工智能ET。在全球上亿观众的见证下,ET隔空计算出5人手中的扑克牌,震惊全场。

在狂欢夜的压轴环节中,ET一出场便秀出强悍的语音识别和交互能力,与主持人华少神同步。众所周知,华少凭借400字/分钟的语速被誉为“中国好舌头”。ET竟然可以实时将华少的现场口播翻译成文字,投在电视机屏幕上,达到极高的准确率。好玩的是,一旦出现错误,ET还会结合上下文语境进行毫秒级修正。

不但能听懂华少的问题,ET还能通过现场观察和思考,模仿人类的声音回答问题。

华少发出挑战:从32张扑克牌中抽出5张,ET你能不能猜出是什么?随后主持人邀请五位现场观众上台,并依次切牌打乱顺序后抽出5张。ET能算出他们手中的牌吗?

ET略略沉思,提了一个小要求,请抽到黑色牌面的观众转身。通过机器视觉识别出转身观众后,ET瞬间计算出答案:梅花A……五个居然全中!ET的神奇表现让主持人大吃一惊,“实在是太,不,可,思,议了!”

理论上32张扑克牌分到5人手里要全部猜对的概率是2400万分之一。ET究竟是如何做到的呢?

“这是一个经典的魔术,不过这次是由人工智能魔术师来表演。32张扑克牌以De Bruijn 序列排列,五人洗牌之后,实际上排列可能减少到32种,ET将转身观众(黑牌)记作1红牌观众记为0。进一步从32种可能性中算出最终的唯一排列”,阿里云人工智能科学家初敏说,通常这个魔术非常考验魔术师的记忆和推算能力。对ET来说,这些都不是难题。

难的是整个过程中需要ET要具备高精确度、高实时性的视频识别能力,并用人类的语言和主持人沟通交流。“因直播环境受到场地、灯光、音效的影响,语音识别、视频识别都会受到很大考验”,初敏说。

据了解,无论是语音识别还是图像识别,底层都依赖于深度学习算法以及大规模计算能力。一套复杂算法模型的训练往往需要千亿级别的样本数据,这就对背后的计算能力提出了很高的要求。

ET代表的是阿里云语音识别、语音合成、自然语言理解、实时图像识别、机器学习的综合技术,背后是阿里云飞天操作系统强大的计算能力。

值得注意的是,这并非ET第一次登上舞台。在今年4月份湖南卫视《我是歌手》的决赛中,ET在直播现场成功预测了李玟夺冠。而在其他领域,ET已经开始担任法庭书记员、超级交通警察、影视投资经理、客服等角色。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
打赏
0
0
0
0
3224
分享
相关文章
阿里云携手DeepSeek,AI应用落地五折起!
近年来,人工智能技术飞速发展,越来越多的企业希望借助AI的力量实现数字化转型,提升效率和竞争力。然而,AI应用的开发和落地并非易事,企业往往面临着技术门槛高、成本投入大、落地效果难以保障等挑战。
25 1
阿里云《AI 剧本生成与动画创作》技术解决方案测评
本问是对《AI 剧本生成与动画创作》的用心体验。结论不是特别理想,在实际使用中仍存在一些问题。
66 22
阿里云《AI 剧本生成与动画创作》解决方案技术评测
随着人工智能技术的发展,越来越多的工具和服务被应用于内容创作领域。阿里云推出的《AI 剧本生成与动画创作》解决方案,利用函数计算 FC 构建 Web 服务,结合百炼模型服务和 ComfyUI 工具,实现了从故事剧本撰写、插图设计、声音合成和字幕添加到视频合成的一站式自动化流程。本文将对该方案进行全面的技术评测,包括实现原理及架构介绍、部署文档指引、具体耗时分析以及实际使用体验。
75 16
阿里云《AI 剧本生成与动画创作》解决方案深度评测
阿里云《AI 剧本生成与动画创作》解决方案深度评测
33 7
阿里云人工智能通识教学合作
阿里云人工智能通识教学合作为高校提供全面支持,包括视频理论课、动手实践课、AI实践平台、教学管理平台、专属算力资源及线下workshop。
59 0
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置,包括CPU+GPU、FPGA等,适用于人工智能、机器学习和深度学习等计算密集型任务。本文整理了阿里云GPU服务器的优惠价格,涵盖NVIDIA A10、V100、T4等型号,提供1个月、1年和1小时的收费明细。具体规格如A10卡GN7i、V100-16G卡GN6v等,适用于不同业务场景,详情见官方页面。
118 11
【PG锦囊】阿里云 RDS PostgreSQL 版插件—AI 插件(rds_ai)
本文介绍了AI 插件(rds_ai)的核心优势、适用场景等,帮助您更好地了解 rds_ai 插件。想了解更多 RDS 插件信息和讨论交流,欢迎加入 RDS PG 插件用户专项服务群(103525002795)
阿里云通义实验室自然语言处理方向负责人黄非:通义灵码2.0,迈入 Agentic AI
在通义灵码 2.0 发布会上,阿里云通义实验室自然语言处理方向负责人黄非分享了代码大模型的演进。过去一年来,随着大模型技术的发展,特别是智能体技术的深入应用,通义灵码也在智能体的基础上研发了针对于整个软件研发流程的不同任务的智能体,这里既包括单智能体,也包括多智能体合并框架,在这样的基础上我们研发了通义灵码2.0。
177 21
阿里云工程师跟通义灵码结伴编程, 用Spring AI Alibaba来开发 AI 答疑助手
本次分享的主题是阿里云工程师跟通义灵码结伴编程, 用Spring AI Alibaba来开发 AI 答疑助手,由阿里云两位工程师分享。
阿里云工程师跟通义灵码结伴编程, 用Spring AI Alibaba来开发 AI 答疑助手

热门文章

最新文章