文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr的whisper-large-v3是没有对应tokenizer吗？

modelscope-funasr的whisper-large-v3 是不是没有对应的 tokenizer？

展开

收起

三分钟热度的鱼 2024-03-20 15:39:29 325 版权

2 条回答

写回答

取消提交回答

请看我回答~

阿里云大降价~

Whisper-large-v3模型通常不提供单独的tokenizer。

在深度学习中，特别是在自然语言处理（NLP）领域，模型和tokenizer通常是配套提供的。Tokenizer负责将文本数据转换为模型可以理解的格式，例如将句子分割成单词或子词（subwords）。然而，对于自动语音识别（ASR）模型，如Whisper-large-v3，它们通常接收原始音频数据作为输入，而不是已经分割好的文本。因此，这些模型不需要传统意义上的tokenizer来预处理文本数据。

此外，如果您需要在ASR之后对接NLP模型，您可能需要一个单独的tokenizer来处理ASR输出的文本数据。在这种情况下，您可以使用适合您NLP模型的tokenizer，例如BPE（Byte Pair Encoding）或其他适用于您所用NLP框架的tokenizer。

总之，Whisper-large-v3作为一个ASR模型，其设计目的是直接从音频文件中提取文本信息，因此不包含用于文本预处理的tokenizer。如果您需要在ASR之后进行NLP处理，您需要另外准备一个tokenizer来适配您的NLP模型。

2024-03-27 19:48:46

赞同展开评论
圆不溜秋的小猫猫

你没下载。
此回答整理自钉群“modelscope-funasr社区交流”

2024-03-20 15:45:07

赞同展开评论

相关问答

modelscope关于 tokenizer 的文档有推荐的读物吗？

146

1

0

modelscope-funasr这个计算文本长度，我理解是不是要调用tokenizer？

255

1

0

modelscope-funasr的Whisper-large-v3这个模型可以和vad一起使用吗？

806

2

0

ModelScope中，有没有镜像hf上的数据集或模型的网站推荐？

183

1

0

modelscope-funasr有考虑做英文实时模型吗？

154

0

0

modelscope-funasr里面的标点模型如果想落地到端上有什么方案不？或者说有相应的案例不？

130

1

0

modelscope-funasr的这个模型去哪里下载呢？

555

0

0

agent在ModelScope 平台训练的模型，怎么用？

207

1

0

使用灵积提供的ModelScope模型定制服务可以对正在训练的模型监控吗？

218

0

0

ModelScope不知道如何找到外网访问大模型地址？

299

0

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

一句话查高铁票并写入文件：揭秘 IntentOrch 的意图驱动编排黑科技

AI元认知雏形

保密检查在本项目中的总体链路：从按钮到任务清单：免费开源的文档编审软件WPS AI插件.察元AI 文档助手

语义压缩，才是提示词工程的底层心法

阿里云自然语言处理全栈对接指南：从入门到企业级集成实战

热门讨论

热门文章

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

modelscope-funasr这个报错怎么处理？

modelscope-funasr 热词如何设置？

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

如何修改通义千问的system prompt，以修改自定义名字

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

我是一个小白，本机部署adaseq，vscode找不到modelscope的module

使用modelscope、Qwen1.8B-chat 模型推理时报错编码错误

下载报错ssl认证失败

modelscope-funasr解析出来的角色人对话不全，是哪里参数没设置对吗？

展开全部

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

Open Interpreter：AI 赋能终端！在终端中对话AI模型进行编程，通过运行代码来完成各种计算机操作任务

FireCrawl：开源 AI 网络爬虫工具，自动爬取网站及子页面内容，预处理为结构化数据

KAG：增强 LLM 的专业能力！蚂蚁集团推出专业领域知识增强框架，支持逻辑推理和多跳问答

展开全部

还有其他疑问?