阿里放大招了!“通义听悟”确实有点新意了,为国产AI大模型打响应用第一枪

简介: 阿里放大招了!“通义听悟”确实有点新意了,为国产AI大模型打响应用第一枪

阿里云 AI 神器通义听悟上线了,宣称是身边的 AI 学习助手。这名字听着挺玄乎的,通义听悟到底是个什么玩意?具体有什么用呢?下面我们一起来看看它有什么神器的地方。

通义听悟介绍

通义听悟是接入了阿里大模型的聚焦音视频内容的工作学习AI助手。基础的功能包含以下几点:

  • 实时语音转写,生成智能记录
  • 文件转写,音视频文件快速上传转成文字
  • 实时翻译,大幅提升跨语言写作效率
  • 快速标记内容,整理内容重点信息,智能全文概要

针对一些细分场景,听悟还设置了不少「宝藏功能」:打开 Chrome 插件,外语学习者和听障人士可以借助双语悬浮字幕条随时随地看无字幕视频,日程冲突时,听悟还可成为职场人士的「开会替身」,在静音情况下入会 AI 可代为记录会议、整理要点;转写结果可下载为字幕文件,方便新媒体从业者视频后期制作;听悟梳理的问答回顾可以让记者、分析师、律师、HR 等群体整理访谈更高效。
通义听悟 Chrome 插件将在近期对所有用户开放下载

具体到玩法,正如通义听悟的「自我介绍」中所说:

  • 如果你是一名职场人士,通义听悟可以帮你记录和回顾你的每一场会议;

  • 如果你是一位学生朋友,通义听悟可以让你不遗漏老师讲授的每一个重点;

  • 如果你是一名金融分析师或媒体从业人员,通义听悟可以存档你每一次的调研访谈;

  • 如果你想以最快的时间看完你最喜爱的视频博主的直播分享,通义听悟可以使你以成倍的速度抓住最精彩的内容。

接下来,让我们看看通义听悟的本领如何。

实测通义听悟

学啥新东西第一个想到的就是去 B 站看看有没有免费课程。

有时候没空看视频,就想能不能把视频中的对话转成文字,这样就不需要自己手动做笔记了,每次回顾只看文字稿就行了。

如何把视频中 UP 主说的话转成文字? 之前一直没找到好使的工具,用了通义听悟,确实不错。

在「通义听悟」上传了一个 30 min 的老蒋解读 B 站商业化的视频,大该用了2 分钟就完成了转文字。

让我震惊的是,不是单纯的视频对话转文字, AI 自动帮你做了总结、分了段落 ...

自动生成的全文概要

自动生成的章节速览

自动生成的对话文字

说实话,用到视频转文字、自动总结功能,对平时自学的小伙伴确实是一个不错的助手,更多的功能,等着大家一起去发现,感兴趣的去申请内测吧!
通义听悟: https://tingwu.aliyun.com/u/6WXvEJc0Jc00JJ30

目录
相关文章
|
5月前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
2237 120
|
5月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
5月前
|
机器学习/深度学习 人工智能 人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
499 121
|
5月前
|
数据采集 人工智能 搜索推荐
智能新纪元:多模态大模型如何重塑人机交互
智能新纪元:多模态大模型如何重塑人机交互
335 113
|
5月前
|
人工智能 人机交互 知识图谱
当AI学会“融会贯通”:多模态大模型如何重塑未来
当AI学会“融会贯通”:多模态大模型如何重塑未来
393 114
|
5月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
703 120
|
5月前
|
人工智能 安全 搜索推荐
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
510 117
|
6月前
|
人工智能 数据处理 云栖大会
云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相
云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相
832 9
云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相