备案控制台

开发者社区 ModelScope模型即服务正文

资源部署与调用相关技术咨询

已解决

就是我想了解一下model scope的技术支撑点：

model scope提供很多模型在线体验的功能，这些在线体验的模型肯定要提前部署好才能供用户直接调用，大概2w多个模型服务支持直接调用体验，这么多的模型应该非常消耗服务器和GPU资源，我想了解一下model scope关于模型部署和资源利用这里用到了哪些技术，从而能够同时提供这么多免费的模型给大家在线体验的。如果是普通企业肯定是做不到的，光是部署这么多模型用到的服务器和GPU就难以想象，还要考虑维护等等。

网上一直查找相关资料也找不到，请问有相关的文章吗？

展开

收起

游客46lpqmadeumoq 2025-09-12 09:34:55 306 版权

1 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

采纳回答

ModelScope不会为每个模型长期占用一个GPU或一台服务器。

容器化封装：每一个模型都被封装成一个独立的、标准化的Docker容器。这个容器内包含了模型文件、依赖的环境（Python, PyTorch, TensorFlow等）、以及一套统一的API接口（例如基于HTTP的RESTful API）。这保证了模型环境的一致性，也实现了模型与模型之间的隔离。

按需加载：当用户点击“在线体验”时，调度系统并不会立即启动一个模型容器。而是先检查资源池中是否有该模型正在运行中的实例。

如果有（模型是“热”的）：直接将用户的请求路由到该运行中的实例，用户几乎无感知地获得结果。

如果没有（模型是“冷”的）：调度系统会从模型仓库中拉取对应的容器镜像，然后在资源池中找一个有空闲资源的服务器（CPU/GPU），启动这个模型的容器。这个过程需要一定时间（十几秒到一分钟，这就是为什么有时体验需要“等待加载”）。

2025-09-12 11:40:48

赞同 277 展开评论

相关问答

请问下我访问接口不通什么原因 Provisional headers are shown

3468

0

0

购买阿里国外的云服务器是否可以访问谷歌？

83243

47

0

sql server的用户名和密码怎么查啊？

37308

21

0

this xml file does not appear to have any style in

51607

10

0

重启Docker后报错：Error response from daemon

2119

0

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60745

31

0

OSS的endpoint如何查看

37362

6

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

133051

28

0

配置了安全组规则，端口还是无法访问

33257

25

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3496

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

南京观海微电子----Verilog流水线设计——Pipeline

南京观海微电子---如何减少时序报告中的逻辑延迟

阿里云服务器收费标准：阿里云最新价格表，ECS、轻量和GPU云服务器报价清单（最新整理）

openEuler操作系统环境：目标检测软件开发实操与性能评估

面向openEuler操作系统：OCR软件应用部署流程、性能评测

热门讨论

热门文章

dataset的版本问题导致与modelscope不兼容

我希望通过damo-YOLO训练1500*1500的图片

ModelScope下载速度慢怎么解决？

ModelScope中，模型下载默认路径在哪个路径？

如何下载modelscope模型？

在ModelScope中，下载模型时的ssl问题怎么解决？!

关于模型的下载，huggingface下载速度太慢，如何在modelscope快速下载？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

在ModelScope中，请问模型下载到本地的具体方法？

com/action/joingroup?code=v1是什么意思

展开全部

Meta SAM3开源：让图像分割，听懂你的话

Z-Image：冲击体验上限的下一代图像生成模型

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

AgentEvolver：让智能体系统学会「自我进化」

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

阿里云通义千问向全社会开放！

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

Mobile-Agent：通过视觉感知实现自动化手机操作，支持多应用跨平台

展开全部

还有其他疑问?