通义大模型使用指南之通义听悟

简介: 本文介绍了阿里云通义平台的注册和使用,主要包括两个部分:注册和功能介绍。用户可以通过访问网址 <https://tongyi.aliyun.com/> 进行注册。在功能介绍中,重点讲解了通义听悟的功能,它提供实时语音转文字、音视频文件转文字、智能总结和中英互译服务。用户可以体验实时录音并标记重点、问题和代办事项,方便会议记录和整理。此外,通义听悟还支持上传音视频文件转写和播客链接转写,以及浏览器插件用于处理网页、手机和微信上的语音内容。

一、注册

我们可以打开以下网站,用手机号注册一个账号即可。

https://tongyi.aliyun.com/

二、使用介绍

如图,我们可以看到有三个大项功能,通义千问、通义万相、通义听悟。下来我们体验一下通义听悟的功能。

1、通义听悟

1、1基本功能

当我们点击上面的通义听悟功能的时候,会出现下面的界面,可以从界面上看到它的主要功能:实时语音转文字,音视频文件转文字,智能总结、中英互译

当我点击立即体验功能时,跳转到如下界面,我们先来体验一下开启实施记录的功能

在界面上我们可以看到有在搜索、筛选、翻译、专用词汇管理、替换词汇

当我开始录音的时候,可以看到下面直接生成了我语音的文字版,在每个文字版内容上面有四个按钮

分别是标记为重点、标记为问题、标记为代办、取消标记的功能。

而且在内容的右侧有一个标准版的文字编辑器界面,方便我们选中其中的文字进行编辑。当我终止和保持,点击下面的终止和保持按钮就行。在我们保持后,在界面上点击重新进入这个文件

会出现如下界面

在上面这个界面我们可以看到主要有这几个功能:全文概要、章节速览、发言总结、要点回顾。在这几个功能中,觉得除去全文概要其他几个功能都差不多,主要是为了在里面列出语音翻译的文字,结合标记为重点、标记为问题、标记为代办、取消标记、一键摘取功能让会议快速生成为一个总结性、有重点有代办有问题的文档,便于跟踪会议结论。

在文件的旁边还有一些其他功能:导出、分析、收藏、移动和删除

1、2其他功能

1、2、1上传音视频

我们点击上传音视频按钮,出现如下界面,按照要求选择一个文件,点击 开始转写,文件就开始转写了,等转写完成就会出现在自己的文件下了,我们可以点击进去看生成的内容,就和上面的基本功能一致了。

1、2、2播客链接转写

关于这块的功能,官方的简介以及写的十分清楚了,我就不再赘述了,但是现在支持的播客列表确实比较少。详细介绍见如何将播客链接转文字?https://tingwu.aliyun.com/helpcenter/1df150

1、2、3浏览器插件

当我们需要处理网页中、手机上、微信上的语音时,我们可以采用如下插件来实现,下面我来演示下edge插件是怎样用的

当我们点击Edge插件时,出现如下界面,安装好之后,

我们打开一个在播放视频的网页,在浏览器中调用此插件

则此时在网页上就会出现插件的录音转文字功能,等录制好之后,这个文件就会出现在自己的列表之下了。

以上就是本期介绍的通义听悟的全部功能了。

目录
相关文章
|
15天前
|
编解码 Cloud Native 算法
通义万相:视觉生成大模型再进化
通义万相是阿里云推出的视觉生成大模型,涵盖图像和视频生成。其2.0版本在文生图和文生视频方面进行了重大升级,采用Diffusion Transformer架构,提升了模型的灵活性和可控性。通过高质量美学标准和多语言支持,大幅增强了画面表现力。此外,视频生成方面引入高压缩比VAE、1080P长视频生成及多样化艺术风格支持,实现了更丰富的创意表达。未来,通义万相将继续探索视觉领域的规模化和泛化,打造更加通用的视觉生成大模型。
|
4月前
|
人工智能 自动驾驶 云栖大会
大模型赋能智能座舱,NVIDIA 深度适配通义千问大模型
9月20日杭州云栖大会上, NVIDIA DRIVE Orin系统级芯片实现了与阿里云通义千问多模态大模型Qwen2-VL的深度适配。阿里云、斑马智行联合NVIDIA英伟达推出舱驾融合大模型解决方案,基于通义大模型开发“能听会看”的智能座舱助理,让车内人员通过语音交流就能操作座舱内的各类应用,享受极致丰富的交互体验。
296 14
|
4天前
|
人工智能 自然语言处理 API
用AI Agent做一个法律咨询助手,罗老看了都直呼内行 feat.通义千问大模型&阿里云百炼平台
本视频介绍如何使用通义千问大模型和阿里云百炼平台创建一个法律咨询助手AI Agent。通过简单配置,无需编写代码或训练模型,即可快速实现智能问答功能。演示包括创建应用、配置知识库、上传民法典文档、构建知识索引等步骤。最终,用户可以通过API调用集成此AI Agent到现有系统中,提供专业的法律咨询服务。整个过程简便高效,适合快速搭建专业领域的小助手。
78 21
|
23天前
|
关系型数据库 机器人 OLAP
智答引领|AnalyticDB与通义千问大模型联手打造社区问答新体验
PolarDB开源社区推出基于云原生数据仓库AnalyticDB和通义千问大模型的“PolarDB知识问答助手”,实现一站式全链路RAG能力,大幅提升查询效率和问答准确率。该系统整合静态和动态知识库,提供高效的数据检索与查询服务,支持多种场景下的精准回答,并持续优化用户体验。欢迎加入钉群体验并提出宝贵意见。
智答引领|AnalyticDB与通义千问大模型联手打造社区问答新体验
|
1月前
|
开发框架 自然语言处理 JavaScript
千问开源P-MMEval数据集,面向大模型的多语言平行评测集
近期,通义千问团队联合魔搭社区开源的多语言基准测试集 P-MMEval,涵盖了高效的基础和专项能力数据集。
千问开源P-MMEval数据集,面向大模型的多语言平行评测集
|
23天前
|
机器学习/深度学习 人工智能 安全
通义视觉推理大模型QVQ-72B-preview重磅上线
Qwen团队推出了新成员QVQ-72B-preview,这是一个专注于提升视觉推理能力的实验性研究模型。提升了视觉表示的效率和准确性。它在多模态评测集如MMMU、MathVista和MathVision上表现出色,尤其在数学推理任务中取得了显著进步。尽管如此,该模型仍存在一些局限性,仍在学习和完善中。
|
4月前
|
存储 关系型数据库 分布式数据库
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
本文介绍了如何使用PolarDB、通义千问和LangChain搭建GraphRAG系统,结合知识图谱和向量检索提升问答质量。通过实例展示了单独使用向量检索和图检索的局限性,并通过图+向量联合搜索增强了问答准确性。PolarDB支持AGE图引擎和pgvector插件,实现图数据和向量数据的统一存储与检索,提升了RAG系统的性能和效果。
|
1月前
|
缓存 API 开发工具
Qwen-coder方向-如果从0开始应用通义千问开源大模型
从0开始接触,带您全面了解Qwen2.5语言模型家族,包括其核心功能、微调方法以及具体应用场景。我们将通过一系列精心准备的应用demo和使用指南,帮助您掌握如何充分利用Qwen2.5的强大能力
288 8
|
2月前
|
人工智能 开发者
再次获奖!世界互联网大会把荣誉给了通义大模型
再次获奖!世界互联网大会把荣誉给了通义大模型
68 11
|
2月前
|
人工智能 边缘计算 自然语言处理
DistilQwen2:通义千问大模型的知识蒸馏实践
DistilQwen2 是基于 Qwen2大模型,通过知识蒸馏进行指令遵循效果增强的、参数较小的语言模型。本文将介绍DistilQwen2 的技术原理、效果评测,以及DistilQwen2 在阿里云人工智能平台 PAI 上的使用方法,和在各开源社区的下载使用教程。

热门文章

最新文章