文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr这个实时语音后端，处理的是pcm还是wav格式的数据呢？

modelscope-funasr这个实时语音后端，处理的是pcm还是wav格式的数据呢？

展开

收起

三分钟热度的鱼 2024-07-03 21:49:35 218 版权

0 条回答

写回答

取消提交回答

相关问答

若依springboot后端和微信小程序数据交互

322

0

0

modelscope-funasr系列，有直接输出srt格式的asr方案嘛？

364

1

0

在modelscope-funasr换了带时间戳的模型但是语音转出来的结果为什么没有时间戳呢？

455

0

0

modelscope-funasr的语音情感识别，如何离线部署？

316

0

0

modelscope-funasr有语音对话分离demo吗？

362

0

0

modelscope-funasr实时流模式，对音频pcm的数据要求是什么呢？

581

0

0

在modelscope-funasr为什么解析出来的文本跟语音差别很大？

254

0

0

modelscope-funasr这样生成的模型对语音的识别结果有没有影响，会不会降低识别率？

342

0

0

modelscope-funasr使用语音转写包有遇到丢字怎么解决？

225

0

0

modelscope-funasr这个模型的训练语音数据以及命令词列表有开源吗？

296

0

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

内存数据库底层存储引擎有什么创新？内存管理与压缩优化解析（阿里云 Tair 实践）

FlashAttention、PagedAttention两代注意力算法，改写大模型推理生态详解.186

DeepSeek V4 Flash 正式版：成绩碾压 Pro 预览版，白菜价

DeepSeek V4 Flash 对标 Gemini 3.6，AI 大跑毒时代

DeepSeek+WorkBuddy，下一代Office工作台来了！

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

高效存储和处理多媒体数据

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

热门讨论

热门文章

【AdaSeq论文解读】COLING-22基于RaNER的垂直行业NER优化

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

如何修改通义千问的system prompt，以修改自定义名字

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

modelscope-funasr 热词如何设置？

modelscope-funasr这个 whisper 对音频长度有限制么？

下载报错ssl认证失败

使用魔搭swift对qwen-14b-chat-int8微调，官方脚本，报错

modelscope-funasr针对默认参数CHUNK_SIZE=[5,10,5]，怎么办？

modelscope-funasr用官方docker启动为什么只能用127.0.0.1链接wss？

展开全部

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

告别单轮静态测评！WorldForge 多动态环境基准，量化 Agent 组件协同能力

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

ImBD：复旦联合华南理工推出 AI 内容检测模型，快速辨别文本内容是否为 AI 生成

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

自然语言生成代码一键搞定！Codex CLI：OpenAI开源终端AI编程助手，代码重构+测试全自动

LongPort MCP：证券业首个券商MCP，AI赋能智能投资新时代，散户也能玩转机构级交易

Archon – 开源 AI 智能体框架，自主生成代码构建 AI 智能体

展开全部

还有其他疑问?