文档备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中，qwen有没有能力传入照片后分析出照片中物体的3d坐标？

ModelScope中，qwen有没有能力传入照片后分析出照片中物体的3d坐标？

展开

收起

小小爱吃香菜 2024-03-26 22:24:27 397 版权

2 条回答

写回答

取消提交回答

为了利利

3d坐标目前还不能。Qwen-VL 可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。https://www.modelscope.cn/models/qwen/Qwen-VL-Chat/summary 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-03-27 12:25:21

赞同展开评论
请看我回答~

阿里云大降价~

Qwen系列模型是阿里巴巴推出的大型多模态模型，其中包括视觉语言模型Qwen-VL。根据目前公开的信息，Qwen具备处理视觉信息能力，但具体是否能够直接分析出照片中物体的3D坐标，这一功能并未明确提及。

Qwen-VL作为视觉多模态版本的大型模型，其主要特点是结合了视觉和语言的处理能力，这意味着它能够理解和分析图像内容，并结合语言信息进行交互和推理。在视觉识别领域，模型通常需要识别和理解图像中的物体、场景和文本等信息。然而，从2D图像中直接提取3D坐标是一项复杂的任务，通常需要专门的算法和技术来处理，如深度学习中的立体匹配、深度估计或使用3D传感器数据。

如果您需要从照片中获取物体的3D坐标，可能需要专门的3D视觉技术或者结合其他硬件设备来实现。例如，使用深度相机或者结构光技术来捕捉物体的三维信息，或者通过计算机视觉算法如立体视觉、光学测距等方法来估算3D坐标。此外，还可以考虑使用专业的3D建模软件或者服务来进行更为复杂的3D重建工作。

总之，虽然Qwen系列模型在视觉多模态领域具有强大的能力，但关于其是否能够直接输出照片中物体的标，目前没有确切的信息。如果需要实现这一功能，可能需要结合其他技术和设备来完成。

2024-03-27 08:48:28

赞同展开评论

相关问答

使用modelscope、Qwen1.8B-chat 模型推理时报错编码错误

351

0

0

java如何使用DashScope SDK对接qwen-long上传文件获取分析结果

566

1

0

在4卡4090（24G）服务器上利用modelscope离线部署Qwen2vl-Flux时报错

520

1

0

通义千问-max不能对知识库的结构化数据进行全量读取和分析吗？

403

1

0

modelscope微调后的多模态大模型Qwen-VL和graghrag相结合构建知识库的案例有嘛？

344

0

0

ModelScope我微调Qwen2-7B-Instruct,loss一直不变是什么原因？

376

1

0

ModelScope中.我下载到本地的模型，分析执行时间好像有点长，有办法提高效率吗？

346

1

0

ModelScope中，qwen2-72b-instruct-awq 支持 json模式吗？

282

0

0

agentscope2、modelscope-agent3、qwen-agent三个项目区别是什么？

973

1

0

modelscope中，为什么用结构的数据集训练qwen-7b-chat后没效果呢？

264

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关解决方案

更多

精准分析检索，打造商品推荐体验

SelectDB实现日志高效存储与实时分析

分析 Agent 实现一键 AI 数据洞察

实现 MySQL 到 ADB 秒级分析性能

Qwen Audio：打造专属 AI 语音助手

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

ModelScope这个免费额度可以在哪里查询啊？

老师请问下，StructBERT FAQ问答-中文-通用领域-base这个模型，加载自己本地数据训练

请问Modelscope互联网如何访问Notebook的服务呢？

ModelScope哪里可以下到bge的embedding啊，我用来本地部署？

modelscope-funasr 热词如何设置？

modelscope的palm模型，对联生成模型训练的src_text通过什么算法确定？

展开全部

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

阿里云通义千问向全社会开放！

Dropout的深入理解（基础介绍、模型描述、原理深入、代码实现以及变种）

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

HTTPS 原理

LTX-2.3开源：视频生成引擎级升级

ModelScope介绍：魔搭社区是什么？在魔搭社区能做哪些事？

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

展开全部

还有其他疑问?