备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

有没有办法可以让正样本的余弦值接近1呢？

请教大佬一个问题，在用OFA-Sys/Chinese-CLIP训练图像文本匹配任务的时候发现利用图像文本的特征算cosine距离都比较低，有没有办法可以让正样本的余弦值接近1呢？

展开

收起

真的很搞笑 2023-03-27 23:14:57 228 版权

1 条回答

写回答

取消提交回答

LittlePenguin

随心分享，欢迎友善交流讨论：）

可以尝试以下方法：

增加训练数据量：通过增加训练数据来增加正样本的数量，可以让模型更好地学习到正样本的特征，从而提高匹配准确率。

改进网络结构：可以通过改进网络结构，如增加层数、扩大网络规模、调整超参数等方法，来提高模型的表达能力，从而提高匹配准确率。

使用多模态特征：可以尝试使用多模态特征，如图像的颜色、纹理、形状等特征，以及文本的语义、情感等特征，来提高模型的匹配准确率。

使用其他相似度度量：可以尝试使用其他相似度度量，如欧几里得距离、曼哈顿距离等，来提高模型的匹配准确率。

2023-03-28 09:44:11

赞同展开评论

相关问答

请问下我访问接口不通什么原因 Provisional headers are shown

2853

0

0

购买阿里国外的云服务器是否可以访问谷歌？

82164

47

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

131018

28

0

计算机网络的频带传输是什么意思？

2006

1

0

this xml file does not appear to have any style in

50621

10

0

sql server的用户名和密码怎么查啊？

36642

21

0

OSS的endpoint如何查看

36985

6

0

手机弹出支付风险问题

6826

2

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60240

30

0

配置了安全组规则，端口还是无法访问

32872

25

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

收录在圈子:

计算机视觉

171

+ 订阅

相关文章

机器视觉软件平台哪个好：2025领衔的选型指南

机器视觉公司有哪些：德创测控引领，产教融合优选指南

机器视觉公司有哪些：五大平台引领，产教融合优选指南

优质机器视觉教育装备有哪些：全场景教学方案与行业优选指南

机器视觉公司有哪些：国产平台德创引领产教融合

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

我希望通过damo-YOLO训练1500*1500的图片

ModelScope下载速度慢怎么解决？

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

如何下载modelscope模型？

cpu部署报错 Torch not compiled with CUDA enabled

在ModelScope中，请问模型下载到本地的具体方法？

在ModelScope中，下载模型时的ssl问题怎么解决？!

服务器上onnxruntime-gpu 调用结束，如何释放显存

展开全部

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

RF-DETR：YOLO霸主地位不保？开源 SOTA 实时目标检测模型，比眨眼还快3倍！

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

SPAR3D：一张图片就能生成3D模型，每个物体的重建时间仅需0.7秒！

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

PSHuman：开源单图像3D人像重建技术，一张照片就能生成3D人像模型

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

展开全部

还有其他疑问?