阿里云“通义听悟”新品上线!通义家族首个消费者端应用产品

本文涉及的产品
视觉智能开放平台,视频资源包5000点
NLP自然语言处理_基础版,每接口每天50万次
视觉智能开放平台,分割抠图1万点
简介: 阿里云“通义听悟”新品上线!通义家族首个消费者端应用产品

6月1日,阿里云宣布通义家族系列产品新进展,聚焦音视频内容记录和理解分析的AI助手“通义听悟”正式上线,并面向公众开放公测。通义听悟内置了通义千问大模型的理解与摘要能力,结合阿里云在音频AI领域深厚的积累,可帮助用户高效地完成对音频视频内容的记录、转写、摘要、整理和分析,实现通义大模型能力与场景化应用的结合,成为人人都可亲手体验和使用的效率工具。


通义听悟是通义家族第一个面向大众消费者端的应用产品。在多媒体时代,人们每天记录、分享和观看大量的音频视频内容,通义听悟通过前沿的语音AI技术,能够准确地将音频视频内容转写为易读的文字。不仅如此,结合通义千问大语言模型的强大理解能力,通过全文摘要、章节速览、发言总结等功能,使用户能够从不同角度“一目十行”地更高效“阅读”音视频内容。随着大模型能力的飞速进步,通义听悟能为用户提供更多先进的能力,帮助用户梳理和挖掘出音视频内容中的信息价值,并将所有的记录和收集都沉淀为知识资产,随时供用户回顾和利用。


借助通义听悟,用户可以如实地记录一堂精彩的讲座、一次深度访谈或一场重要会议,它将成为用户身边的智能伙伴,“听”遍所有内容,“悟”得其中深意


 针对一些细分场景,听悟还有不少“宝藏功能”——

外语学习者和听障人士可以通过“实时语音识别+翻译”的功能随时随地看无字幕视频;

记者、分析师、律师朋友可以利用“问答回顾”功能,迅速拿到访谈笔记;

对于上班族来说,AI还可成为“开会替身”,解放双手,自动产出会议纪要;

学生们可以用“章节速览”功能,以最快速度学习和复习网课并抓住重要知识点的内容。


“依托大模型,为每一个人提供全新的音视频体验”,阿里云CTO周靖人介绍,通义听悟瞄准工作生活中日益增长的音频视频内容,帮助用户记录重要会议的要点,捕捉讲座中的精彩知识,整理访谈中的关键信息,为用户提供更深入、更高效的智能服务。通义听悟在阿里巴巴内部已经被广泛使用、并受到许多同学的喜爱。在项目经理、市场调研、文秘、人力资源等群体中更是被广泛使用。此次对外发布后,更广泛的用户将可以与我们一道体验到大模型带来的体验和效率提升。



(阿里云CTO周靖人)



在发布会上,听悟展现了它背后融合的十多项AI功能,全面提升了知识从音视频向图文形态转化的效率。除了“听力好”,能高准确度生成会议记录、区分不同发言人,这款产品“悟性也高”,通过大模型的能力加持,可以给音视频划分章节并形成摘要、总结全文及每个发言人观点、整理待办事项和关注重点,帮助用户完成对内容主旨思想的消费过程。通义听悟同时宣布包括高阶AI能力在内的全部功能,如大模型摘要功能,所有用户均可登陆体验。同时官网还提供了丰富的权益活动使用户能够赢取使用时长,来满足日常使用的需求。

通义听悟当前已经与阿里云盘打通,存储在阿里云盘中的音频视频内容可以方便地导入通义听悟进行AI的分析和理解,在云盘内在线播放视频时也可自动匹配字幕。绑定阿里云盘账号的听悟用户可以共享阿里云盘超大存储空间,进行个人音视频的管理。同时通义听悟的小程序版后续将在钉钉、阿里云盘、夸克等阿里旗下产品中推出,并与这些产品内部的场景功能及音视频内容融汇贯通。同时,通义听悟的AI能力也将进一步服务于阿里巴巴内部各类应用,如广受用户欢迎的“钉钉闪记”背后便集成了有关能力,为钉钉用户提供智能音视频会议、文档速记等产品。



通义听悟传送带👇:

tingwu.aliyun.com


相关文章
|
2月前
|
人工智能 JSON 自然语言处理
基于阿里云通义千问的AI模型应用开发指南
阿里云通义千问是阿里巴巴集团推出的多模态大语言模型平台,提供了丰富的API和接口,支持多种AI应用场景,如文本生成、图像生成和对话交互等。本文将详细介绍阿里云通义千问的产品功能,并展示如何使用其API来构建一个简单的AI应用,包括程序代码和具体操作流程,以帮助开发者快速上手。
715 3
|
1月前
|
机器学习/深度学习 人工智能 物联网
通义灵码在人工智能与机器学习领域的应用
通义灵码不仅在物联网领域表现出色,还在人工智能、机器学习、金融、医疗和教育等领域展现出广泛应用前景。本文探讨了其在这些领域的具体应用,如模型训练、风险评估、医疗影像诊断等,并总结了其提高开发效率、降低门槛、促进合作和推动创新的优势。
通义灵码在人工智能与机器学习领域的应用
|
21天前
|
JSON 自然语言处理 Serverless
基于阿里云通义千问开发智能写作助手
现代办公中,撰写邮件、会议记录、报告等任务耗费大量时间。一个智能写作助手能显著提升效率,帮助用户快速生成高质量的文本内容。阿里云通义千问作为阿里巴巴推出的强大大语言模型(LLM),具备出色的自然语言理解与生成能力,非常适合用于开发智能写作工具。本博客将介绍如何基于通义千问构建一个智能写作助手,实现高效的内容生成和编辑功能。
52 2
|
29天前
|
NoSQL 安全 测试技术
Redis游戏积分排行榜项目中通义灵码的应用实战
Redis游戏积分排行榜项目中通义灵码的应用实战
52 4
|
1月前
|
自然语言处理 API C++
阿里通义推出SmartVscode插件,自然语言控制VS Code,轻松开发应用,核心技术开源!
SmartVscode插件深度解析:自然语言控制VS Code的革命性工具及其开源框架App-Controller
|
1月前
|
开发者
10万奖金!通义千问Qwen技术应用有奖征文
分享Qwen应用实践,赢取丰厚奖金
|
2月前
|
存储 算法 C语言
通义灵码在考研C语言和数据结构中的应用实践 1-5
通义灵码在考研C语言和数据结构中的应用实践,体验通义灵码的强大思路。《趣学C语言和数据结构100例》精选了五个经典问题及其解决方案,包括求最大公约数和最小公倍数、统计字符类型、求特殊数列和、计算阶乘和双阶乘、以及求斐波那契数列的前20项和。通过这些实例,帮助读者掌握C语言的基本语法和常用算法,提升编程能力。
88 4
|
19天前
|
机器学习/深度学习 自然语言处理 算法
通义灵码在金融与教育领域的应用
通义灵码在金融与教育领域的应用展现了其强大潜力。在金融行业,它通过优化风险评估、智能投顾及交易算法,提升业务效率与安全性;在教育领域,则通过个性化学习方案、智能化教学资源生成及编程教育辅助,革新教学方式,满足多样化需求,为行业注入新活力。
|
13天前
|
缓存 API 开发工具
Qwen-coder方向-如果从0开始应用通义千问开源大模型
从0开始接触,带您全面了解Qwen2.5语言模型家族,包括其核心功能、微调方法以及具体应用场景。我们将通过一系列精心准备的应用demo和使用指南,帮助您掌握如何充分利用Qwen2.5的强大能力
181 8
|
1月前
|
传感器 存储 人工智能
通义灵码在跨领域应用拓展之物联网篇
在数字化时代,通义灵码作为一款强大的人工智能代码生成工具,正在物联网领域展现巨大潜力。本文将探讨其在设备端和云端的应用,包括传感器数据采集、设备控制、数据存储与管理、远程设备管理等方面,展示其提高开发效率、降低门槛及增强系统稳定性的优势。
通义灵码在跨领域应用拓展之物联网篇