我的虚拟分身:通义听悟试用体会

简介: 我的虚拟分身:通义听悟试用体会

AI时代百家争鸣

自从GPT开年炸场之后

国内厂家纷纷退出了自己的大模型AI对标产品

百度的文心开了第一炮

虽然褒贬不一

但目前个人使用情况

文心一格的美术制作还是有亮点的


然后比较出彩的产品

主要是讯飞星火

在问答方面,已经非常接近GPT了

讯飞的核心优势是语音领域

厚积薄发


今天主要想讲讲阿里的通义

目前有两个产品

千问和听悟

其中,通义千问是邀请制

需要以企业名义申请

很多小伙伴无从下手

那么我们重点讲讲:通义听悟

普通人就可以无门槛申请

什么是通义听悟

这个产品有点类似科大讯飞的 “讯飞听见” 系列

我们往往会遇到这样的场景

和甲乙方开会,和上下游开会,各种内部会议

总有个苦逼的小伙伴

担当会议记录员

会后要将纪要整理群发确认等等繁琐的工作

这种工作不亚于给外国影视作品增加字幕的难度


让我们来看看通义听悟

主打会议、访谈、学习等大量对话的场景

实现

输入:音视频
输出:文字

如果是简单的转换,那就和科大讯飞的产品相似度极高

听悟主打的功能是AI辅助

包括

  1. 同步翻译,目前支持中、英、粤
  2. 区分不同的发言人,形成对话记录
  3. 提炼文字概要,总结中心思想
  4. 提取关键词,待办任务

AI发展到这一步

我感觉翻译、书记员又要失业了

按官方说法

1小时的音视频

转换只要5分钟

试用

首先进入官网首页

https://tingwu.aliyun.com

点击右上角注册

目前是试运行阶段

直接注册后,会获得2小时的免费时长

以及2G存储空间


接下来,请准备一段录音或视频

比如选取一小段《百年孤独》的朗诵

上传视频文件

这里支持识别的方式包括

中文、英文、粤语、中英混合
不翻译、英语翻译
不区分人、双人、多人等

点击“开始转写”

会先上传到阿里云的空间,然后进行转换

由于我这次的素材比较简单

很快就转换完成了

看看效果

点击左侧“我的记录”

找到转换的文件

可以看到转换的文本都出来了

只有一个小小的错误

上校的名字翻译错了

这次实验的文章比较短

如果有比较长的记录

就能看到更全面的效果

例如章节归纳、发言总结等等

对于学生来说

还可以对老师的教学课题内容进行自动总结

快速形成笔记

对于课程疲劳,或是外教的场景

特别有用

而且听悟支持自动区分发言人

常用发言人只需要设置一次即可

简单有效

大家可以自己尝试一下

相关文章
|
XML 存储 前端开发
想要制作沙盒游戏?那么这一款插件你一定不能错过(Unity3D)
今天给大家介绍一款简单而又强大的多人沙盒游戏开发插件VOXL。 VOXL是一款简单且易于理解的多重体素沙盒游戏,使用Unity的UNET网络系统开发。 由于服务器和客户端是一体的,所以我们不用再费心搭建服务器,会大大提高我们的开发效率。 VOXL目前只包含大约2500行干净、优雅和易于理解的源代码。
|
5月前
|
人工智能 分布式计算 运维
阿里云携手 MiniMax 构建云原生数仓最佳实践:大模型时代的 Data + AI 数据处理平台
MiniMax 是全球领先的通用人工智能公司,致力于推动AGI发展。依托自研多模态大模型,服务超200国1.57亿用户及5万企业客户。携手阿里云构建云原生数仓与Data+AI平台,实现数据高效处理、成本大幅降低,支撑全球业务高速迭代与AI创新落地。
1040 107
|
数据可视化 API 开发者
R1类模型推理能力评测手把手实战
随着DeepSeek-R1模型的广泛应用,越来越多的开发者开始尝试复现类似的模型,以提升其推理能力。
828 3
|
数据采集 Web App开发 API
B站高清视频爬取:Python爬虫技术详解
B站高清视频爬取:Python爬虫技术详解
|
移动开发 前端开发 搜索推荐
《前端技术基础》第01章 HTML基础【合集】
超文本标记语言(HyperText Markup Language,简称 HTML)是构建网页结构的基础标记语言。它与 CSS、JavaScript 协同,负责搭建网页“骨架”,用标签组织内容,像标题、段落、图片等元素,通过起始与结束标签(部分可单用,如`<img>`)界定层级与布局,将信息有序整合。标签含特定语义,向浏览器传达展示方式,为网页准确呈现及后续美化、交互筑牢根基。
504 25
|
人工智能 自然语言处理
通义听悟AI能力问题之通义听悟定义如何解决
通义听悟AI能力问题之通义听悟定义如何解决
602 0
|
网络协议 JavaScript API
深入浅出 WebSocket:实现实时 web 通信
在现代Web应用中,实时通信至关重要。WebSocket通过单个TCP连接实现全双工通信,允许服务器主动向客户端发送消息。本文介绍了WebSocket的核心概念、实现方法及其优势。WebSocket建立了持久连接,支持实时数据传输,减少服务器负载,并提供双向通信。通过JavaScript API可轻松建立连接、发送接收消息及处理异常。使用WebSocket,开发者能构建更动态的Web应用。
|
前端开发 Java 程序员
springboot 学习十五:Spring Boot 优雅的集成Swagger2、Knife4j
这篇文章是关于如何在Spring Boot项目中集成Swagger2和Knife4j来生成和美化API接口文档的详细教程。
2465 1
|
前端开发 JavaScript 数据安全/隐私保护
从0到1开发一个自己的npm包完整过程
创建自己的 npm 包涉及六个步骤:1) 注册 npm 账号;2) 使用 `npm init` 初始化项目,确保 package.json 的 name 唯一且 private 为 false;3) 开发项目,可封装 UI 组件、函数库或命令行工具;4) 本地调试,通过 `npm link` 在项目中测试;5) `npm login` 登录账号,可能需切换至官方仓库;6) 使用 `npm publish` 发布项目。注意版本号递增,无意义的包不建议发布。
从0到1开发一个自己的npm包完整过程

热门文章

最新文章