文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

C-MTEB评估qwen模型

本人将
qwen3_embedding_0.6B
qwen3_embedding_4B
qwen3_reranker_0.6B
qwen3_reranker_4B
四个模型以及
bce_reranker_base_v1
bce_embedding_base_v1
两个模型用C-MTEB中的30个数据集进行评估，为什么会出现
（1）rerank模型在c_mteb中的reranking任务的得分比embedding模型在c_mteb中的reranking任务的低得多
（2）qwen的得分比官方给的差10+
（尽管我只计算MTEB中6类task最重要的指标得分）
后面又进行了acge_text_embedding的评估，发现和官方给出的数据相差并不大
有无大佬指点一手
（模型、数据集全下载到了本地）

展开

收起

通义千问3家族

游客qv34insecrx5c 2025-08-04 13:47:37 440 版权

0 条回答

写回答

取消提交回答

相关问答

qwen3-asr-flash 模型的HTTP API接口不支持本地文件上传吗？

417

1

0

使用 dashscope-sdk-java 调用qwen3-max-preview模型回答问题，没有

507

0

0

怎么使用vllm部署最新的qwen3的mbedding 和reranker模型呢

1160

0

0

通义灵码能不能自定义LLM模型？

953

1

0

使用qwen-mt-turbo模型的openapi限流如何解除

1398

0

0

qwen模型微调上传数据集时，如何书写数据集的本地路径？

402

0

0

qwen-long模型

363

1

0

vscode集成通义灵码后，使用deepseek模型，会经常遇到连接超时的情况

661

2

0

Unichat - qwen2.5 - 32B - c1 模型已经下载下来在运行python报错

363

1

0

通义千问关于nx二次开发(c++)里的很多函数方法解释是错的，或者说模型没有覆盖到

265

2

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

阿里云自然语言处理全栈对接指南：从入门到企业级集成实战

MCP 工具生态升温后，企业 AI 中台要解决什么问题？

告别单轮静态测评！WorldForge 多动态环境基准，量化 Agent 组件协同能力

分层结构化决策对话智能体灵钥 V5.1 全新升级｜具备观点边界、关系感知的深度思辨 Agent，配套线上 Demo 与真实用户数据采集方案

从零搓一个语言模型，然后把它变成认知体的声带

相关解决方案

更多

GLM-5.2：长任务时代开源旗舰模型

OpenAI 重磅开源，快速部署GPT-OSS模型

日志安全审计与合规性评估

基于 Spark 和 PyTorch 的模型训练方案

模型蒸馏：让0.6B模型媲美235B模型

热门讨论

热门文章

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

modelscope-funasr 热词如何设置？

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

langchain中llms.Tongyi 这个模型具体调用的是哪个通义模型

modelscope-funasr出现以下报错，该用什么funasr版本？

如何修改通义千问的system prompt，以修改自定义名字

modelscope-funasr基于paraformer微调了粤语试了下，效果不太理想。怎么调整？

如何将space-t-cn的模型导出为onnx格式

gpt3,加载数据时，MsDataset.load报错

在modelscope-funasr为啥把语音模型下载到本地，调用识别出的文本为啥会乱码？

展开全部

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

语义压缩，才是提示词工程的底层心法

告别单轮静态测评！WorldForge 多动态环境基准，量化 Agent 组件协同能力

分层结构化决策对话智能体灵钥 V5.1 全新升级｜具备观点边界、关系感知的深度思辨 Agent，配套线上 Demo 与真实用户数据采集方案

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

从零搓一个语言模型，然后把它变成认知体的声带

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

展开全部

还有其他疑问?