我的虚拟分身:通义听悟试用体会

本文涉及的产品
多模态交互后付费免费试用,全链路、全Agent
简介: 我的虚拟分身:通义听悟试用体会

AI时代百家争鸣

自从GPT开年炸场之后

国内厂家纷纷退出了自己的大模型AI对标产品

百度的文心开了第一炮

虽然褒贬不一

但目前个人使用情况

文心一格的美术制作还是有亮点的


然后比较出彩的产品

主要是讯飞星火

在问答方面,已经非常接近GPT了

讯飞的核心优势是语音领域

厚积薄发


今天主要想讲讲阿里的通义

目前有两个产品

千问和听悟

其中,通义千问是邀请制

需要以企业名义申请

很多小伙伴无从下手

那么我们重点讲讲:通义听悟

普通人就可以无门槛申请

什么是通义听悟

这个产品有点类似科大讯飞的 “讯飞听见” 系列

我们往往会遇到这样的场景

和甲乙方开会,和上下游开会,各种内部会议

总有个苦逼的小伙伴

担当会议记录员

会后要将纪要整理群发确认等等繁琐的工作

这种工作不亚于给外国影视作品增加字幕的难度


让我们来看看通义听悟

主打会议、访谈、学习等大量对话的场景

实现

输入:音视频
输出:文字

如果是简单的转换,那就和科大讯飞的产品相似度极高

听悟主打的功能是AI辅助

包括

  1. 同步翻译,目前支持中、英、粤
  2. 区分不同的发言人,形成对话记录
  3. 提炼文字概要,总结中心思想
  4. 提取关键词,待办任务

AI发展到这一步

我感觉翻译、书记员又要失业了

按官方说法

1小时的音视频

转换只要5分钟

试用

首先进入官网首页

https://tingwu.aliyun.com

点击右上角注册

目前是试运行阶段

直接注册后,会获得2小时的免费时长

以及2G存储空间


接下来,请准备一段录音或视频

比如选取一小段《百年孤独》的朗诵

上传视频文件

这里支持识别的方式包括

中文、英文、粤语、中英混合
不翻译、英语翻译
不区分人、双人、多人等

点击“开始转写”

会先上传到阿里云的空间,然后进行转换

由于我这次的素材比较简单

很快就转换完成了

看看效果

点击左侧“我的记录”

找到转换的文件

可以看到转换的文本都出来了

只有一个小小的错误

上校的名字翻译错了

这次实验的文章比较短

如果有比较长的记录

就能看到更全面的效果

例如章节归纳、发言总结等等

对于学生来说

还可以对老师的教学课题内容进行自动总结

快速形成笔记

对于课程疲劳,或是外教的场景

特别有用

而且听悟支持自动区分发言人

常用发言人只需要设置一次即可

简单有效

大家可以自己尝试一下

相关文章
|
6月前
|
数据采集 Web App开发 API
B站高清视频爬取:Python爬虫技术详解
B站高清视频爬取:Python爬虫技术详解
|
11月前
|
存储 关系型数据库 MySQL
mysql的begin end嵌套
本文介绍了MySQL中如何使用`begin`和`end`关键字进行事务或存储过程的嵌套操作,并强调了编写嵌套代码时需要注意作用域的重要性。
145 0
mysql的begin end嵌套
|
12月前
|
网络协议 JavaScript API
深入浅出 WebSocket:实现实时 web 通信
在现代Web应用中,实时通信至关重要。WebSocket通过单个TCP连接实现全双工通信,允许服务器主动向客户端发送消息。本文介绍了WebSocket的核心概念、实现方法及其优势。WebSocket建立了持久连接,支持实时数据传输,减少服务器负载,并提供双向通信。通过JavaScript API可轻松建立连接、发送接收消息及处理异常。使用WebSocket,开发者能构建更动态的Web应用。
|
11月前
|
前端开发 Java 程序员
springboot 学习十五:Spring Boot 优雅的集成Swagger2、Knife4j
这篇文章是关于如何在Spring Boot项目中集成Swagger2和Knife4j来生成和美化API接口文档的详细教程。
1643 1
|
11月前
|
前端开发 Docker 容器
主机host服务器和Docker容器之间的文件互传方法汇总
Docker 成为前端工具,可实现跨设备兼容。本文介绍主机与 Docker 容器/镜像间文件传输的三种方法:1. 构建镜像时使用 `COPY` 或 `ADD` 指令;2. 启动容器时使用 `-v` 挂载卷;3. 运行时使用 `docker cp` 命令。每种方法适用于不同场景,如静态文件打包、开发时文件同步及临时文件传输。注意权限问题、容器停止后的文件传输及性能影响。
2709 0
|
设计模式 缓存 JavaScript
什么是代理对象
【9月更文挑战第3天】什么是代理对象
429 0
|
11月前
|
人工智能 文件存储 计算机视觉
YOLO系列模型发展史
YOLO系列模型从YOLOv3到YOLOv10,不断优化实时目标检测性能和速度。最新版本YOLOv8增加了实例分割、姿态估计等功能。此外,还包括Segment Anything Model(SAM)、MobileSAM、FastSAM、YOLO-NAS、RT-DETR和YOLO-World等模型,分别在不同场景下提供高效的目标检测和分割能力。
409 0
|
前端开发 JavaScript 数据安全/隐私保护
从0到1开发一个自己的npm包完整过程
创建自己的 npm 包涉及六个步骤:1) 注册 npm 账号;2) 使用 `npm init` 初始化项目,确保 package.json 的 name 唯一且 private 为 false;3) 开发项目,可封装 UI 组件、函数库或命令行工具;4) 本地调试,通过 `npm link` 在项目中测试;5) `npm login` 登录账号,可能需切换至官方仓库;6) 使用 `npm publish` 发布项目。注意版本号递增,无意义的包不建议发布。
从0到1开发一个自己的npm包完整过程
|
缓存 JavaScript API
「Vue3系列」Vue3 计算属性(computed)、监听属性(watch)
在 Vue 3 中,计算属性(Computed Properties)是一种强大的功能,它允许你声明一个依赖于其他响应式数据属性的属性,并且这个属性的值会根据其依赖的数据的变化而自动更新。计算属性是基于它们的依赖关系进行缓存的,只有在它的相关依赖发生改变时才会重新求值。
1726 0