【求助】关于使用Qwen2-7B-VL多模型模型识别图片某个元素的坐标的问题

关于使用Qwen2-7B-VL多模型模型识别图片某个元素的坐标的问题
我在使用的时候,模型返回的坐标很不准确
image.png

image.png

这是图片上两个位置相差较大的文字元素,但是模型返回的坐标居然是一样的。针对这种情况需要怎么处理。求助!!

展开
收起
游客ffug4tlsqqei4 2024-11-12 15:21:23 126 分享 版权
1 条回答
写回答
取消 提交回答
  • 您可以尝试使用Qwen2-7B-VL模型的物体检测功能来获取图片中特定元素的坐标,具体操作方法可以参考阿里云官方文档中的模型使用指南。如果遇到具体技术问题,建议咨询一下阿里云的工作人员。如果对您有帮助的话,可以帮忙采纳一下。谢谢。

    2025-02-10 15:41:05
    赞同 82 展开评论

包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理