产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
百炼大模型
Modelscope模型即服务
弹性计算
云原生
数据库
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
物联网
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
>
ModelScope模型即服务
>
自然语言处理
>
正文
在modelscope-funasr中官方实例语音识别pcm报错是什么问题?
在modelscope-funasr中官方实例语音识别pcm报错是什么问题?请参考图片:
展开
收起
花开富贵111
2024-08-14 10:34:44
36
0
0
条回答
写回答
取消
提交回答
相关问答
语音识别接口报错'The audio file cannot be downloaded.'
51
2
0
modelscope-funasr的实时语音识别支持的并发数在哪里可以看?
121
1
0
在modelscope-funasr用的paraformer的一个语音识别模型,怎么加上热词?
114
0
0
modelscope-funasr实时流模式,对音频pcm的数据要求是什么呢?
109
0
0
modelscope-funasr的VAD算法报错,如何处理?
87
0
0
modelscope-funasr的多说话人语音识别模型 支持实时听写吗?
74
0
0
在modelscope上下载qwen2的0.5版本,左边这个正常加载,右边这个报错,为什么?
117
1
0
在modelscope-funasr中有没有用做实时语音转文字的demo?
53
1
0
在modelscope-funasr中模型推理有报错,这个要怎么改?
52
0
0
modelscope-funasr这个模型 给的音频文件是中文,为什么识别出来,不是英文就是拼音?
29
1
0
ModelScope模型即服务
自然语言处理
包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域
我要提问
热门讨论
热门文章
modelscope-funasr的FunClip怎么安装的?
2637
练的pth模型文件,怎么转成bin文件?
1099
请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token?
1357
open webui的RAG功能根本用不起来
984
如何下载llama模型到本地?
3000
modelscope-funasr在AutoModel里设置了关闭了,结果还是会打日志,为什么?
530
关于通义千问Qwen-7B-Chat模型下载问题
1734
modelscope-funasr的sensevoice还不支持热词,是吗?
280
modelscope-funasr微调sensevoice时,best acc 一直为0是为什么?
142
modelscope-funasr热词怎么设置才有效?
510
展开全部
Smolagents:三行代码就能开发 AI 智能体,Hugging Face 开源轻量级 Agent 构建库
158
DeepSeek-V2.5-1210 在线开放使用!支持联网搜索,在各大领域的表现得到全面提升
311
LLM2LLM:LLM2LLM:用 LLM 来增强 LLM !通过教师模型合成数据,增强学生模型的训练数据集
119
智胜未来:国内大模型+Agent应用案例精选,以及主流Agent框架开源项目推荐
2677
DeepSeek Engineer:集成 DeepSeek API 的开源 AI 编程助手,支持文件读取、编辑并生成结构化响应
123
DeepSeek V3:DeepSeek 开源的最新多模态 AI 模型,编程能力超越Claude,生成速度提升至 60 TPS
201
KAG:增强 LLM 的专业能力!蚂蚁集团推出专业领域知识增强框架,支持逻辑推理和多跳问答
81
PsycoLLM:开源的中文心理大模型,免费 AI 心理医生,支持心理健康评估与多轮对话
80
OpenHands:能自主检索外部知识的 AI 编程工具,自动执行命令、网页浏览和生成代码等操作
67
R2R:开源的 RAG 集成系统,支持多模态处理、混合搜索、知识图谱构建等增强检索技术
54
展开全部
相关课程
更多
ModelScope社区Library技术架构介绍
229
1
去学习
达摩院智能语音交互 - 人机对话技术浅析
154
4
去学习
达摩院智能语音交互 - 声纹识别技术
2873
4
去学习
阿里巴巴智能语音交互技术与应用
7252
7
去学习
达摩院智能语音交互 - 语音识别技术
314
4
去学习
达摩院智能语音交互 - 语音合成技术
587
4
去学习
相关文章
阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点
《光存储与3D存储:开启人工智能硬件存储新时代》
Gemini Coder:基于 Google Gemini API 的开源 Web 应用生成工具,支持实时编辑和预览
重启“APP工厂”,张一鸣要做AI时代的爱迪生?
VideoRAG:长视频理解的检索增强生成技术,支持多模态信息提取,能与任何 LVLM 兼容
相关电子书
更多
智能语音交互:阿里巴巴的研究与实践
立即下载
你好,Pal——阿里智能全新语音交互解决方案
立即下载
智能语音交互:大众身边的AI
立即下载