文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr实时流模式，对音频pcm的数据要求是什么呢？

modelscope-funasr实时流模式，对音频pcm的数据要求是什么呢？目前使用单声道，16k,int16,sample大小是640，20ms的输入频率，返回的实时的asr文本text结果是空的。参数如下:model_asr_streaming = AutoModel(
model="iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online",
model_revision="v2.0.4",
ngpu=args.ngpu,
ncpu=args.ncpu,
device=args.device,
disable_pbar=True,
disable_log=True,
). record_stream: {'message_type': 'record_stream', 'mode': 'online', 'chunk_size': '5,10,5', 'chunk_interval': 10, 'encoder_chunk_look_back': 4, 'decoder_chunk_look_back': 1, 'wav_name': 'microphone', 'is_speaking': True, 'itn': True}
online, {'key': 'rand_key_7In9ZMJLsCfMZ', 'text': ''}
online, {'key': 'rand_key_1qeoePtwBldGD', 'text': ''}
online, {'key': 'rand_key_a4cFut1DdZ04Z', 'text': ''}
online, {'key': 'rand_key_dtl2HUetz1vtA', 'text': ''}

展开

收起

三分钟热度的鱼 2024-08-21 19:59:16 571 版权

0 条回答

写回答

取消提交回答

相关问答

modelscope创空间用gradio模式，如何直接使用自己设计的前端index

318

0

0

在modelscope-funasr为什么识别的内容和音频不一致呀？

268

1

0

modelscope-funasr 可以输入音频吗而不是文件？

321

1

0

modelscope-funasr的音频情感识别，用sensevoice好还是emotion2ve？

461

0

0

modelscope-funasr使用离线这个推理示例音频的时候，报了错误，是为什么？

310

1

0

在modelscope-funasr当音频文件超过一个小时后，显存溢出怎么解决？

398

1

0

modelscope-funasr实时识别，发送的流数据，一次喂好长的数据过去比较好？

210

0

0

在modelscope-funasr中请问vad模型是只能用16k采样率的音频吗？

281

0

0

在modelscope-funasr中找不到有效的 OpenPGP 数据，如何解决？

1026

7

0

modelscope-funasr中如果用10小时数据做微调， 2张T4的卡，大概耗时多久？

335

1

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

线下资金车手视角下 AI 语音钓鱼全链路风险与智能检测防御研究

AI 英语教学智能体开发

AI 英语口语 APP的开发

KET/PET 考试平台的开发

AI 英语在线考试平台的开发

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

数据守护：防勒索攻击数据保障

热门讨论

热门文章

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

modelscope的palm模型，对联生成模型训练的src_text通过什么算法确定？

modelscope-funasr 热词如何设置？

modelscope-funasr如何释放显存呢？

langchain中llms.Tongyi 这个模型具体调用的是哪个通义模型

关于使用ModelScope离线启动已下载过的模型时遇到的问题

modelscope-funasr的sensevoice还不支持热词，是吗？

modelscope-funasr使用bytes类型数据传入，识别效果很差怎么解决？

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

达摩院用128张GPU烧出“中文版GPT-3”，我试了下，这文风不是开往幼儿园的车…

展开全部

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

OpenAI 12天发布会内容全纪录！一文快速回顾获知亮点信息，原文附发布会中文字幕视频

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

Botgroup.chat：超有趣的开源 AI 聊天室！多个 AI 在线互怼，一键搭建你的专属 AI 社群

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

LongPort MCP：证券业首个券商MCP，AI赋能智能投资新时代，散户也能玩转机构级交易

Jina Reader：一键将网页内容转为适合 LLM 处理的文本格式，自动抓取和清洗网页内容，支持多种输出格式

通古大模型：古籍研究者狂喜！华南理工开源文言文GPT：AI自动断句+写诗翻译，24亿语料喂出来的学术神器

展开全部

还有其他疑问?