备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

请问modelscope-funasr这个可能是哪里出了问题啊？

我做cam++模型export的时候，int8量化之后onnx模型15Mb,未量化后的onnx模型35Mb，
推理时内存占用情况：未量化模型占用81Mb，量化后模型占用67Mb
推理速度情况（多次反复测试）：未量化模型占用108ms，量化后模型占用170ms，量化后速度反而更慢了！
请问modelscope-funasr这个可能是哪里出了问题啊？from funasr import AutoModel
import torch
import onnx
from onnxruntime.quantization import QuantType, quantize_dynamic
import os
model = AutoModel(model="damo/speech_campplus_sv_zh-cn_16k-common",
model_revision="v2.0.2",
device="cpu"
)

dummy_input = torch.rand(1, 553,80)
quant=True
model=model.model
model_script = model #torch.jit.trace(model)
model_path = "camplus.onnx"
input_names=["input"]
output_names=["output"]
verbose=True
torch.onnx.export(
model_script,
dummy_input,
model_path,
verbose=verbose,
opset_version=14,
input_names=input_names,
output_names=output_names,
dynamic_axes={'input': [0, 1]}
)

quant

if quant:
quant_model_path = "camplus_quant.onnx"
if not os.path.exists(quant_model_path):
onnx_model = onnx.load(model_path)
quantize_dynamic(
model_input=model_path,
model_output=quant_model_path,
weight_type=QuantType.QUInt8,
)
print("export Done!") 这是我的转换代码

展开

收起

三分钟热度的鱼 2024-03-20 15:51:09 147 版权

1 条回答

写回答

取消提交回答

请看我回答~

阿里云大降价~
根据您提供的信息，ModelScope-Funasr在量化过程中出现了一些问题。以下是一些可能的原因：
1. 量化算法问题：量化算法可能会导致模型的精度损失，从而影响推理速度和内存占用。您可以尝试使用不同的量化算法或者调整量化参数来改善结果。
2. 模型结构问题：某些模型结构可能不适合进行量化，例如包含大量非线性激活函数的模型。这可能导致量化后的模型性能下降。
3. 硬件平台问题：不同的硬件平台对量化的支持程度不同，可能会影响量化后模型的性能。您可以尝试在其他硬件平台上测试量化后的模型，以确定是否存在硬件相关的问题。
4. 量化工具链问题：量化工具链可能存在bug或者不完善的地方，导致量化后的模型出现问题。您可以尝试使用其他量化工具链或者更新当前工具链的版本。
为了解决这个问题，您可以尝试以下步骤：
1. 检查您的代码中是否有正确的量化配置设置，并确保这些设置是在加载模型之前进行的。
2. 尝试使用不同的量化算法或者调整量化参数来改善结果。
3. 检查模型的结构是否适合进行量化，如果不适合，可以考虑修改模型结构或者使用其他模型。
4. 在不同的硬件平台上测试量化后的模型，以确定是否存在硬件相关的问题。
5. 如果问题依旧存在，可以考虑联系ModelScope-Funasr的社区或者技术支持，寻求更具体的帮助。
2024-03-27 19:07:40

赞同展开评论

相关问答

请问下我访问接口不通什么原因 Provisional headers are shown

3443

0

0

购买阿里国外的云服务器是否可以访问谷歌？

83207

47

0

sql server的用户名和密码怎么查啊？

37288

21

0

this xml file does not appear to have any style in

51578

10

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60730

31

0

重启Docker后报错：Error response from daemon

2090

0

0

配置了安全组规则，端口还是无法访问

33245

25

0

OSS的endpoint如何查看

37339

6

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

133005

28

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3472

1

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

MajorRAG 概述（1/3）

蚂蚁百宝箱“一箱搞定”会展智能，「桐小乌」为乌镇互联网大会提供全天候一站式向导服务

最佳实践丨让苏东坡“复活”！我用Qwen3-8B实现了与千古文豪的跨时空对话

全来店×蚂蚁百宝箱：智能体开启连锁餐饮智慧化服务新时代

贝聿铭的 “数字续作”：蚂蚁百宝箱 × 苏州博物馆，用 AI 重构文化地标

热门讨论

热门文章

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

modelscope-funasr实时设别，mode:2pass 还是online，2个有啥不一样？

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

练的pth模型文件，怎么转成bin文件？

modelscope-funasr的sensevoice还不支持热词，是吗？

modelscope-funasr支持粤语么？

modelscope-funasr的html客户端的地址如何更改？

modelscope-funasr这个问题是什么情况？

modelscope-funasr有输出字幕文件srt的功能吗？

modelscope-funasr这里在启动时，怎么让它不启动ssl呢？

展开全部

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

SPO：如何优化提示词？大模型最懂如何优化自己！开源自监督提示词优化工具，让AI自主优化提示词

手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型，创建个性化 AI 助手

FireCrawl：开源 AI 网络爬虫工具，自动爬取网站及子页面内容，预处理为结构化数据

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

KAG：增强 LLM 的专业能力！蚂蚁集团推出专业领域知识增强框架，支持逻辑推理和多跳问答

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

展开全部

还有其他疑问?