达摩院AI神器“听悟”发布进阶版,支持客户访谈、员工招聘等企业场景需求

简介: “你只需专注会议,其余一切交给听悟。”11月4日,2022杭州云栖大会,阿里巴巴达摩院研发的智能产品“听悟”进阶版亮相大会现场。仅需一台个人电脑,观众和媒体记者们即可体验全面集成达摩院语音语言智能的最新AI助理,感受会议场景的前沿AI实践。

这款“AI神器”在云栖大会上引起广泛关注,它不仅听得准,而且悟性高,可为体验者实时转写会议、秒速生成会议纪要、自动区分不同说话人、生成视频字幕,并具备会议实时翻译、问答自动提取等高阶能力,在企业会议、金融尽调、媒体访谈、教育培训等泛会议场景有广泛应用前景。(“听悟”使用界面展示)相比去年云栖大会发布的版本,“听悟”今年在技术和产品功能上进行了全方位升级,新增三大核心AI能力:中英文自由说,采用内嵌多语种专家模块的“混合专家系统”,无需手动切换语种即可准确识别中英大篇幅混说的场景;会议实时翻译,边说边翻译,无需等待,让跨国沟通更加高效顺畅;QA问答对抽取,结合说话人特征、多阶段训练技术,自动提取问题,让访谈整理更轻松。(“听悟”进阶版可实现问答抽取,人物及对话为示例)

同时,针对会议行业伙伴及企业用户的多样化需求,“听悟”发布了PaaS产品形态,以简单易调用的接口方式开放核心能力,并提供多种前沿创新算法,从而满足企业在音视频会议、培训直播、招聘面试、智能客服等多种细分场景的不同需求。

(“听悟”在招聘细分场景中的应用)

阿里巴巴达摩院语音实验室负责人鄢志杰表示,“过去十年‘人-机’交流是语音AI解锁的核心场景,更复杂的‘人-人’交流是下一个高地,未来听悟将在‘人-人’交流场景继续深入探索,提供安全、保真、精准的AI识别、分析与理解能力,并基于内容为企业提供多种智能办公服务,让AI真正为人所用,替人分担,协助处理重复繁琐的工作事务。”

相关文章
|
26天前
|
人工智能 自然语言处理 Serverless
阿里云函数计算 x NVIDIA 加速企业 AI 应用落地
阿里云函数计算与 NVIDIA TensorRT/TensorRT-LLM 展开合作,通过结合阿里云的无缝计算体验和 NVIDIA 的高性能推理库,开发者能够以更低的成本、更高的效率完成复杂的 AI 任务,加速技术落地和应用创新。
103 14
|
1月前
|
人工智能 自然语言处理 搜索推荐
AI战略丨SaaS 遇见 AI, 企业教培开启新范式
“我们会不断完善整体的工程能力,争取以最低的成本,帮助用户训练他们所需要的、好用的 AI 产品。”
|
21天前
|
机器学习/深度学习 人工智能 运维
|
10天前
|
人工智能 自然语言处理 运维
钉钉x昇腾:用AI一体机撬动企业数字资产智能化
大模型在过去两年迅速崛起,正加速应用于各行各业。尤其在办公领域,其主要模态——文字和图片,成为了数字化办公的基础内容,催生了公文写作、表格生成、文本翻译等多种应用场景,显著提升了工作效率。然而,AI引入办公场景也带来了数据安全与成本等问题。为此,钉钉与昇腾联合推出的“钉钉专属AI一体机解决方案”,通过本地化部署解决了数据安全、成本高昂及落地难等痛点,实现了从硬件到软件的深度协同优化,为企业提供了开箱即用的AI服务,推动了办公场景的智能化升级。
41 11
|
20天前
|
人工智能 算法 大数据
懂场景者得AI,瓴羊发布年度产品智能化战略
9月20日,瓴羊智能科技(以下简称瓴羊)在2024云栖大会上举办了“Data × AI:企业服务智能化,价值增长新动能”专场论坛。阿里巴巴集团副总裁、瓴羊智能科技CEO 朋新宇在会上发布年度产品智能化战略:“(算法 + 算力 + 数据) x 场景 ”,强调企业必须重视场景,只有通过解构场景、重构业务,才能真正拥抱AI,带来突破性增长。
|
16天前
|
人工智能 Prometheus Cloud Native
新场景、新能力,AI-native 时代的可观测革新
借助 AI-native 可观测解决方案,阿里云为用户提供开箱即用的覆盖大模型应用、大模型到基础设施的全链路实时观测、告警与诊断能力,帮助企业在复杂的数字化转型过程中更有效地确保资源的高效利用与业务的持续成功。
|
14天前
|
人工智能 搜索推荐 vr&ar
【通义】AI视界|美国司法部AI新规:AI犯错,企业承担
本文介绍了最新科技动态,包括Sora视频模型即将迎来重大升级,提升生成速度和质量;Meta发布十年秘密研发的Orion AR眼镜,展现未来计算平台新形态;Runway推出电影扶持计划,资助500万美元支持电影人;Notion AI全新发布,整合多项功能提高生产力;美国司法部发布AI新规,明确企业需对其AI系统的违法行为负责。更多内容,请访问通义官网体验。
|
15天前
|
机器学习/深度学习 人工智能 监控
CEO和CIO如何在企业中引领AI革命 扮演战略领航者的角色
CEO和CIO如何在企业中引领AI革命 扮演战略领航者的角色
|
2月前
|
人工智能 文字识别 算法
打造全场景、跨领域、多模态的AI工作流 | 开源图像标注工具 X-AnyLabeling v2.4.0 正式发布!
X-AnyLabeling是一款强大的辅助标注工具,集成了AI推理引擎和丰富功能,为图像数据工程师提供一站式解决方案。它支持图像和视频文件的自动标注,提供了包括矩形框、多边形在内的七种标注样式,适应多样化的训练场景需求。X-AnyLabeling内置了多种SOTA级AI模型,如YOLO、SAM系列等,并支持GPU加速和多种数据集格式的导入导出,确保高效的数据处理。此外,它还具备良好的跨平台兼容性,可在多种操作系统上运行,并提供详尽的帮助文档和社区支持,帮助用户轻松上手并解决使用过程中遇到的问题。
119 2
打造全场景、跨领域、多模态的AI工作流 | 开源图像标注工具 X-AnyLabeling v2.4.0 正式发布!
|
2月前
|
存储 人工智能 数据处理
面向AI场景的数据处理和数据检索
本文分享了AI场景下面临的数据处理与检索挑战及解决方案。AI内容生产涉及数据准备、模型训练、推理及应用四大环节,其中数据准备环节面临数据来源复杂、格式多样及数据量激增的挑战,模型训练环节需解决推理准确性问题,AI应用环节则需克服接口兼容性难题。 为应对这些挑战,阿里云存储OSS与智能媒体管理IMM提供百余种数据处理能力,并升级数据索引功能支持向量检索,助力构建多模态检索应用。此外,还介绍了Serverless数据处理方案,可日均处理百亿级别文件,通过OSS数据索引能力,客户能快速构建RAG检索增强,同时实现多模态检索的搭建,显著提升AI应用的效能和用户体验。
173 14

热门文章

最新文章