开发者社区 > ModelScope模型即服务 > 计算机视觉 > 正文

有没有办法可以让正样本的余弦值接近1呢?

请教大佬一个问题,在用OFA-Sys/Chinese-CLIP训练图像文本匹配任务的时候发现利用图像文本的特征算cosine距离都比较低,有没有办法可以让正样本的余弦值接近1呢?

展开
收起
真的很搞笑 2023-03-27 23:14:57 181 0
1 条回答
写回答
取消 提交回答
  • 随心分享,欢迎友善交流讨论:)

    可以尝试以下方法:

    增加训练数据量:通过增加训练数据来增加正样本的数量,可以让模型更好地学习到正样本的特征,从而提高匹配准确率。

    改进网络结构:可以通过改进网络结构,如增加层数、扩大网络规模、调整超参数等方法,来提高模型的表达能力,从而提高匹配准确率。

    使用多模态特征:可以尝试使用多模态特征,如图像的颜色、纹理、形状等特征,以及文本的语义、情感等特征,来提高模型的匹配准确率。

    使用其他相似度度量:可以尝试使用其他相似度度量,如欧几里得距离、曼哈顿距离等,来提高模型的匹配准确率。

    2023-03-28 09:44:11
    赞同 展开评论 打赏

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载