云栖发布:通义听悟AI能力再进化,开放API接口

简介: 云栖发布:通义听悟AI能力再进化,开放API接口

文章来自 阿里语音AI公众号

继今年6月份,聚焦音视频内容的大模型产品“通义听悟”上线,成为国内首个开放公测的大模型应用产品。通义听悟作为工作学习AI助手,以通义千问大模型为基座,融合了音视频AI技术的功能和优势,拥有感知记忆领悟理解融会贯通的能力,全面提升知识从音视频向图文形态转化的效率,包括高准确度生成对话记录、快速出摘要总结、提取回答关键问题等。

(阿里云CTO周靖人 · 2023云栖大会)

近月来,一键提取PPT发现更多播客内容云盘文件一键听悟,对音视频内容提问的“小悟”助手等功能陆续上新。截止目前,通义听悟已累计服务100万用户,深受白领、学生、媒体人等群体的喜爱,每日处理音视频超过5万份。


image.png  00:13

(通义听悟新功能速览)在2023年云栖大会上,通义听悟AI能力再升级,推出“小悟助手”,方便用户直接对自己的记录进行提问和对话,不仅支持单记录及跨记录内容的问答,还支持多语言自由提问。同时,通义听悟还开放了API接服务,所有功能皆可接入企业系统,通过大模型分析理解音视频资料,开发构建企业自己的听悟。

(通义实验室语音团队负责人鄢志杰 · 2023云栖大会

正如通义实验室语音团队负责人鄢志杰所言:“随着API的开放,通义听悟的能力将通过行业专属大模型的定制进入垂直领域,并能为行业提供颇具壁垒的竞争力。我们特别期待与开发者们一道共创,让通义听悟的能力在更多的行业里开花结果。“

(通义听悟API获取方式

相关文章
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
智谱AI推出的GLM-4V-Flash是一款专注于图像理解的免费开放大模型,提供API接口支持用户上传图片URL或Base64编码图片获取详细的图像描述。该模型通过深度学习和卷积神经网络技术,简化了图像分析流程,提高了开发效率,适用于内容审核、辅助视障人士、社交媒体、教育和电子商务等多个应用场景。
85 14
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
|
2天前
|
人工智能 大数据 测试技术
自主和开放并举 探索下一代阿里云AI基础设施固件创新
12月13日,固件产业技术创新联盟产业峰会在杭州举行,阿里云主导的开源固件测试平台发布和PCIe Switch固件技术亮相,成为会议焦点。
|
26天前
|
人工智能 自然语言处理 Swift
探索面向开放型问题的推理模型Marco-o1,阿里国际AI团队最新开源!
阿里国际AI团队发布的新模型Marco-o1,不仅擅长解决具有标准答案的学科问题(如代码、数学等),更强调开放式问题的解决方案。该模型采用超长CoT数据微调、MCTS扩展解空间等技术,提升了模型在翻译任务及复杂问题解决上的表现。研究团队还开源了部分数据和模型,供社区使用和进一步研究。
|
1月前
|
人工智能 API
通过API调用通义千问时出现DataInspectionFailed的解决办法(玄学版)
在使用qwen-plus API进行长文本翻译时,遇到了DataInspectionFailed错误,提示输入数据可能包含不当内容。尽管确认文本无敏感内容,但误判依然发生。通过将每个分段的字符数从1000降低到700,问题得以解决。建议在处理长文本时,减少每次请求的字符数以避免误判。
224 2
|
2月前
|
人工智能 机器人 API
【通义】AI视界|谷歌Q3财报:Gemini API六个月增长14倍,公司超25%的新代码由AI生成
本文内容由通义自动生成,涵盖谷歌Q3财报、马斯克xAI融资、九巨头联盟挑战英伟达、Meta加大AI投入及麻省理工研究LLM与人脑相似性等热点资讯。更多精彩内容,请访问通通知道。
|
3月前
|
编解码 自然语言处理 机器人
通义千问Qwen2-VL开源,API可直接调用!
通义千问宣布开源第二代视觉语言模型Qwen2-VL,并推出2B、7B两个尺寸及其量化版本模型。同时,旗舰模型Qwen2-VL-72B的API已上线阿里云百炼平台,用户可直接调用。
1625 9
|
3月前
|
人工智能 运维 安全
阿里云飞天企业版“智算升级”,为政企打造AI时代最开放的云
阿里云正式发布飞天智算—飞天企业版V3.18,为政企客户打造AI时代最开放的云。此次升级,飞天企业版将智算能力深度融入云平台,实现“一云多算”,满足政企客户对云平台“云+AI”协同发展需求,为AI技术大规模在政企领域应用做好准备。
197 11
|
4月前
|
人工智能 自然语言处理 API
云栖发布:通义听悟AI能力再进化,开放API接口
云栖发布:通义听悟AI能力再进化,开放API接口
|
4月前
|
人工智能 API 数据安全/隐私保护
通义听悟AI能力问题之API接口服务的潜在应用类别如何解决
通义听悟AI能力问题之API接口服务的潜在应用类别如何解决
87 0
下一篇
DataWorks