kws_util 下载不了

简介: 用户在树莓派上安装了一个语音唤醒环境,并使用了CTC语音唤醒模型“小云小云”。但在执行推理时遇到了错误。已尝试安装[kws_tuil],安装不成功,更换镜像后仍然安装失败,目前无法解决此问题。

用树莓派安装语音唤醒环境,模型是这个CTC语音唤醒-移动端-单麦-16k-小云小云,但是在推理的时候报错了。

$ conda create -n modelscope python=3.7
$ conda activate modelscope
$ pip install torch torchvision torchaudio
$ pip install "modelscope[audio]" -f https://modelscope.oss-cn-beijing.aliyuncs.com/releases/repo.html
$ pip install tensorboardX

上面是搭建环境的命令,中途有包冲突,解决了,在用下面代码推理的时候报错了。

用了这个代码进行推理的

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

kwsbp_16k_pipline = pipeline(
    task=Tasks.keyword_spotting,
    model='./speech_charctc_kws_phone-xiaoyun')

kws_result = kwsbp_16k_pipline(audio_in='https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/KWS/pos_testset/kws_xiaoyunxiaoyun.wav')
print(kws_result)

然后报了下面这个错误

image.png

尝试安装【kws_tuil】

image.png

换了镜像还是报错,不知道该怎么解决了

image.png

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
计算机视觉
OpenCV(三十八):二维码检测
OpenCV(三十八):二维码检测
1119 0
|
机器学习/深度学习 自然语言处理 达摩院
Modelscope 工程介绍及实战演示| 学习笔记
快速学习 Modelscope 工程介绍及实战演示
Modelscope 工程介绍及实战演示| 学习笔记
|
3月前
|
机器学习/深度学习 人工智能 监控
猪仔行为检测数据集(3700张高清标注)| YOLO实战 智慧养殖与猪只健康监测
本数据集开源3700张高清标注图像,覆盖猪仔9类核心行为(饮水、进食、撞击、跪地、拱蹭、休息、站立、吮乳、踩踏),严格按YOLO格式划分训练/验证/测试集,适配YOLOv5/v8/v11,助力智慧养殖与健康监测。
|
网络安全 开发工具
SSH断开连接时长控制ServerAliveInterval
SSH断开连接时长控制ServerAliveInterval
973 0
|
数据采集 人工智能 自然语言处理
AI终于能听懂宝宝说话了!ChildMandarin:智源研究院开源的低幼儿童中文语音数据集,覆盖22省方言
ChildMandarin是由智源研究院与南开大学联合推出的开源语音数据集,包含41.25小时3-5岁儿童普通话语音数据,覆盖中国22个省级行政区,为儿童语音识别和语言发展研究提供高质量数据支持。
1494 20
AI终于能听懂宝宝说话了!ChildMandarin:智源研究院开源的低幼儿童中文语音数据集,覆盖22省方言
|
2月前
|
存储 安全 API
《QClaw配置导入的深层逻辑:99%的人都用错了这一步》
本文打破“QClaw配置导入只是点一下按钮”的普遍认知,从作者踩坑的真实经历切入,深入拆解了配置导入背后鲜为人知的技术机制。文章揭示QClaw采用增量合并而非全量覆盖的核心策略,详解敏感信息加密、自动快照等隐藏功能,对比图形界面、命令行、手动替换三种导入方式的优劣与适用场景。同时给出优化导入速度、规避版本兼容风险、保障配置安全的实用技巧,最终指出配置只是工具,只有理解其底层设计逻辑,才能真正用好别人的分享并打造专属配置。
270 1
|
数据采集 人工智能 数据处理
覆盖16省方言的老人语音数据集!SeniorTalk:智源研究院开源全球首个超高龄老年人中文语音数据集
SeniorTalk是由智源研究院与南开大学联合推出的全球首个中文超高龄老年人对话语音数据集,包含202位75岁及以上老年人的55.53小时语音数据,涵盖16个省市的不同地域口音。
1912 5
覆盖16省方言的老人语音数据集!SeniorTalk:智源研究院开源全球首个超高龄老年人中文语音数据集
|
3月前
|
人工智能 弹性计算 安全
OpenClaw超全指南:是什么?能干嘛?怎么部署?
OpenClaw是2026年热门开源AI智能体,不止能对话,更能执行文件操作、浏览器自动化、代码编写、邮件处理等本地任务。支持云/本地部署,阿里云提供一键部署方案。助你轻松拥有可干活的“数字员工”!
2031 1
|
6月前
|
人工智能 JavaScript 机器人
Coze vs Dify vs n8n:三大AI智能体开发平台全面对比
2025年三大AI智能体平台深度对比:Coze零代码快速搭建,适合个人与轻量应用;Dify专注企业级大模型应用,平衡易用与灵活;n8n强在自动化集成,支持高度定制。根据需求选型,助力高效开发。
|
9月前
|
机器学习/深度学习 数据采集 人工智能
猪在日常饲养环境行为数据集(3000 张图片已划分、已标注)| 适用于目标检测任务
本 猪在日常饲养环境行为数据集(3000 张图片已划分、已标注),在数据规模、类别覆盖与标注精度方面均具有较高的实用性。它不仅为智能养殖系统的研究与应用提供了坚实的数据基础,也为学术研究者探索农业人工智能提供了重要资源。

热门文章

最新文章