人工智能魔术 阿里云ET双11狂欢秀能力

简介: 本文讲的是人工智能魔术 阿里云ET双11狂欢秀能力【IT168 云计算】作为双11背后庞大系统的大脑,忙碌的阿里云人工智能ET还抽空表演了一个神奇的魔术。

本文讲的是人工智能魔术 阿里云ET双11狂欢秀能力【IT168 云计算】作为双11背后庞大系统的大脑,忙碌的阿里云人工智能ET还抽空表演了一个神奇的魔术。

  11月10日晚,“天猫双11狂欢夜”在深圳大运中心拉开巨幕。除了汇聚全球半个娱乐圈的明星外,还有一位拥有“超能力”的神秘嘉宾登场——阿里云人工智能ET。在全球上亿观众的见证下,ET隔空计算出5人手中的扑克牌,震惊全场。


  在狂欢夜的压轴环节中,ET一出场便秀出强悍的语音识别和交互能力,与主持人华少神同步。众所周知,华少凭借400字/分钟的语速被誉为“中国好舌头”。ET竟然可以实时将华少的现场口播翻译成文字,投在电视机屏幕上,达到极高的准确率。好玩的是,一旦出现错误,ET还会结合上下文语境进行毫秒级修正。

  不但能听懂华少的问题,ET还能通过现场观察和思考,模仿人类的声音回答问题。

  华少发出挑战:从32张扑克牌中抽出5张,ET你能不能猜出是什么?随后主持人邀请五位现场观众上台,并依次切牌打乱顺序后抽出5张。ET能算出他们手中的牌吗?

  ET略略沉思,提了一个小要求,请抽到黑色牌面的观众转身。通过机器视觉识别出转身观众后, ET瞬间计算出答案:梅花A……五个居然全中!ET的神奇表现让主持人大吃一惊,“实在是太,不,可,思,议了!”

  理论上32张扑克牌分到5人手里要全部猜对的概率是2400万分之一。ET究竟是如何做到的呢?

  “这是一个经典的魔术,不过这次是由人工智能魔术师来表演。32张扑克牌以De Bruijn 序列排列,五人洗牌之后,实际上排列可能减少到32种,ET将转身观众(黑牌)记作1红牌观众记为0。进一步从32种可能性中算出最终的唯一排列”,阿里云人工智能科学家初敏说,通常这个魔术非常考验魔术师的记忆和推算能力。对ET来说,这些都不是难题。

  难的是整个过程中需要ET要具备高精确度、高实时性的视频识别能力,并用人类的语言和主持人沟通交流。“因直播环境受到场地、灯光、音效的影响,语音识别、视频识别都会受到很大考验”,初敏说。

  据了解,无论是语音识别还是图像识别,底层都依赖于深度学习算法以及大规模计算能力。一套复杂算法模型的训练往往需要千亿级别的样本数据,这就对背后的计算能力提出了很高的要求。

  ET代表的是阿里云语音识别、语音合成、自然语言理解、实时图像识别、机器学习的综合技术,背后是阿里云飞天操作系统强大的计算能力。

  值得注意的是,这并非ET第一次登上舞台。在今年4月份湖南卫视《我是歌手》的决赛中,ET在直播现场成功预测了李玟夺冠。而在其他领域,ET已经开始担任法庭书记员、超级交通警察、影视投资经理、客服等角色。

原文发布时间为:2016-11-11

本文作者:张苗苗

本文来自云栖社区合作伙伴IT168,了解相关信息可以关注IT168

原文标题:人工智能魔术 阿里云ET双11狂欢秀能力

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
29天前
|
人工智能 文字识别 监控
|
26天前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
|
1月前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
|
28天前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
1月前
|
人工智能 数据处理 API
阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来
Apache Flink Agents 是由阿里云、Ververica、Confluent 与 LinkedIn 联合推出的开源子项目,旨在基于 Flink 构建可扩展、事件驱动的生产级 AI 智能体框架,实现数据与智能的实时融合。
290 6
阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来
|
25天前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
28天前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI 上下文工程是管理大模型输入信息的系统化框架,解决提示工程中的幻觉、上下文溢出与信息冲突等问题。通过上下文的采集、存储、加工与调度,提升AI推理准确性与交互体验。AnalyticDB PostgreSQL 版提供增强 RAG、长记忆、Supabase 等能力,助力企业构建高效、稳定的 AI 应用。
|
26天前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
228 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
26天前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI上下文工程是优化大模型交互的系统化框架,通过管理指令、记忆、知识库等上下文要素,解决信息缺失、长度溢出与上下文失效等问题。依托AnalyticDB等技术,实现上下文的采集、存储、组装与调度,提升AI Agent的准确性与协同效率,助力企业构建高效、稳定的智能应用。

热门文章

最新文章