备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope像千问，百川这样的大模型，无法直接通过inference API的方式请求吗？

ModelScope像千问，百川这样的大模型，无法直接通过inference API的方式请求吗？

展开

收起

青城山下庄文杰 2023-08-06 08:28:27 197 版权

2 条回答

写回答

取消提交回答

Ð

可以尝试在阿里云的dashscope 灵积上去体验api服务-此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2023-08-08 10:40:34

赞同展开评论
算精通

北京阿里云ACE会长

模型大小：大型模型往往具有巨大的参数量和计算量，可能需要较长的推理时间和更高的计算资源。这可能导致通过 API 请求的耗时过长，以至于请求超时或无法有效地处理。

推理资源限制：通过 Inference API 进行推理需要一定的计算资源和内存。大型模型可能需要更多的计算资源和内存才能运行，而 API 可能有一定的资源限制，无法满足大型模型的要求。

网络带宽和延迟：大型模型的推理请求可能会产生大量的数据传输，而网络带宽和延迟可能成为瓶颈。在请求过程中，数据的传输速度可能会受到网络连接的限制，从而导致请求的延迟增加。

为了解决这些挑战，常见的方法是将大型模型部署在专用的推理服务器或边缘设备上，并通过 API 请求将计算推理任务发送到这些服务器进行处理。这样可以充分利用专用硬件和高性能计算资源，提高推理效率和响应速度。

此外，一些模型可能提供特定的推理服务或解决方案，以更好地支持大规模的推理请求。您可以查看相关的文档或联系模型提供方，了解是否提供了专门针对大规模推理的解决方案。

2023-08-07 20:22:45

赞同展开评论

相关问答

千问Qwen3 32B大模型部署需要什么配置的GPU服务器？

649

1

0

请问语音大模型Qwen-ASR是否支持输出字级别的时间戳？

24

0

0

普通轻薄本能跑哪些多模态大模型

253

1

0

千问Qwen3 14B大模型部署最低配置GPU服务器要求？

714

1

0

Qwen3 32B,14B,8B大模型部署分别需要多少显存，GPU服务器如何选？

1650

1

0

千问大模型Qwen3-8B、4B、32B、235B、0.6B参数含义，需要什么配置的服务器部署？

437

1

0

部署大模型Qwen3 32B,14B,8B参数的大模型部署分别需要多少显存？

2002

1

0

Qwen3大模型中0.6B 4B 32B 235B参数是什么意思？

146

1

0

obsidian插件Smart Composer添加modelscope的API后，执行报错

99

0

0

完全无法连接互联网的情况下，如何在vscode中登录通义灵码并远程链接到内网超算服务器上的大模型？

194

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

相关文章

商品图片批量上传接口设计与实现

唯一！阿里云专有云全维度满分

商品视频关联接口技术详解

商品价格动态调整接口技术详解

解决方案体验 | 基于阿里云高效实现前后端分离架构升级

热门讨论

热门文章

ModelScope下载速度慢怎么解决？

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

cpu部署报错 Torch not compiled with CUDA enabled

如何下载modelscope模型？

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

在ModelScope中，下载模型时的ssl问题怎么解决？!

com/action/joingroup?code=v1是什么意思

ModelScope API 400 怎么办？

ModelScope中，我想量化下这个模型，modelscope 有对应的方法和文档么？

展开全部

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

RF-DETR：YOLO霸主地位不保？开源 SOTA 实时目标检测模型，比眨眼还快3倍！

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

InvSR：开源图像超分辨率生成模型，提升分辨率，修复老旧照片为超清图像

Cobalt：开源的流媒体下载工具，支持解析和下载全平台的视频、音频和图片，支持多种视频质量和格式，自动提取视频字幕

SPAR3D：一张图片就能生成3D模型，每个物体的重建时间仅需0.7秒！

OOTDiffusion：开源AI虚拟试衣工具，智能适配性别和体型自动调整衣物

展开全部

还有其他疑问?