文档备案控制台

开发者社区 ModelScope模型即服务正文

modelscope-funasr微调时候的数据准备格式是什么样的呢？

modelscope-funasr微调时候的数据准备格式是什么样的呢？是每一条数据一行json对吗？json里的这些字段是什么意思呢？

展开

收起

嘟嘟嘟嘟嘟嘟 2024-01-05 06:38:40 402 版权

3 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

FunASR的微调数据准备格式，开发者可以参考在GitHub上的"finetune.py"文件进行修改。这个文件中包含了微调所需的相关设置。同时，如果你使用的是私有数据集进行微调，需要在ModelScope中保留相关模型的名称。此外，确保你的数据集符合FunASR的数据要求，以确保微调过程的顺利进行。

2024-01-06 13:22:28

赞同展开评论
sunrr

在使用modelscope-funasr进行微调时，数据准备格式需要特定的文件和目录结构。首先，数据集目录需要包括train/wav.scp和train/text两个文件，分别用于存储音频文件路径和对应的文本标注。

在准备数据时，每一条数据通常占据一行json文件。json文件中的字段表示具体的数据信息。例如，wav.scp文件中的每一行可能包含一个音频文件的绝对路径，对应text文件中的该行的文本标注。

在微调完成后，您可以使用新的模型来进行语音识别。执行特定命令，可以对音频进行解码推理。请注意，这只是一种常见的做法，实际操作可能需要根据具体情况进行调整。

2024-01-05 09:31:09

赞同展开评论
番茄酱脑袋

稍后将在文档中更新微调相关内容。此回答整理自钉群“modelscope-funasr社区交流”

2024-01-05 09:02:53

赞同展开评论

相关问答

modelscope-funasr的Sensevoice的数据准备特别慢是什么原因呢？

192

0

0

modelscope-funasr系列，有直接输出srt格式的asr方案嘛？

275

1

0

modelscope微调后的多模态大模型Qwen-VL和graghrag相结合构建知识库的案例有嘛？

235

0

0

ModelScope我试着用swift 微调后微调的模型都失去逻辑怎么办？

257

1

0

在modelscope-funasr中java的底层怎么接受数据的,我想自己编写wss客户端?

182

0

0

ModelScope输出看了下只有这四个数据集的features，没有格式，怎么处理？

170

1

0

ModelScope中，florence2模型微调时，数据集格式是不是"query"？

274

1

0

ModelScope微调之后没有效果是数据集太少了吗？

247

1

0

ModelScope中，微调参数里面有可能会导致模型回复中断的参数或者是数据里面没有长文本的数据？

166

1

0

ModelScope中，以本地模型为原型训练模型怎么实现，能用.gguf格式的模型训练吗？

213

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

淘宝商品详情API接入指南

通过1688开放平台API根据商品ID获取商品详情

玩转纳斯达克与纽交所：美股数据 API 对接全指南

Codex SDK 控制台消息解析完全指南

飞书接入OpenClaw机器人：使用阿里云轻量应用服务器38元一年搞定

相关解决方案

更多

基于数据闪回，快速恢复数据

零代码微调，打造领域专属大模型

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

热门讨论

热门文章

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

部署coclaw，报错如下，怎么办？应该点击哪里？

云端部署coclaw报错

com/action/joingroup?code=v1是什么意思

copaw安装后选择ollma为啥报错不能安装相关模型？

ModelScope中，模型下载默认路径在哪个路径？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

dataset的版本问题导致与modelscope不兼容

ModelScope中apikey在哪申请？

展开全部

OpenClaw（原 Clawdbot）钉钉对接保姆级教程手把手教你打造自己的 AI 助手

保姆级 OpenClaw （原 Clawdbot）飞书对接教程手把手教你搭建 AI 助手

Qwen3.5 中等规模模型系列正式开源：更强智能，更低算力

中企投资印度新能源“有戏”吗？

Qwen3.5：迈向原生多模态智能体

MiniMax M2.5 开源，低成本Agent时代来了！社区Day0部署、工具调用、推理&提示词参数实战来啦！

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

别再用 LangChain 搭 RAG 了：Dify 和 n8n 哪个才是你真正需要的

展开全部

还有其他疑问?