xGPU来啦!免费GPU资源开发花样AI应用!

简介: 为了降低AI应用服务和推广的门槛,解决开发者面临的实际痛点,ModelScope社区推出 xGPU 服务,让大家能够免费使用高性能 GPU 资源,托管自己的AI应用服务。

创意无限,却被GPU的“硬核瓶颈”卡住了吗?

GPU的强大算力是AI模型和应用的心脏,但高昂的云GPU租金和个人搭建服务器的成本让许多开发者望而却步。

为了降低AI应用服务和推广的门槛,解决开发者面临的实际痛点,ModelScope社区推出 xGPU 服务,让大家能够免费使用高性能 GPU 资源,托管自己的AI应用服务。

01

创空间xGPU介绍

什么是创空间?

创空间(Studio)是魔搭社区提供的AI模型应用服务模块,支持开发者基于魔搭上LLM,多模态,音视频等各种模态的模型,通过快捷的编程、以及零代码地通过交互式配置,实现AI应用的快速搭建。应用发布后,可以通过社区专属体验页进行分享。通过对接优秀的Gradio、Streamlit等开源框架,开发者可以通过熟悉的Python语言,迅速在创空间上搭建自己的AI应用,即便没有前端等全栈开发背景,也能完整的实现应用页面的搭建。同时魔搭社区开源的ModelScope-studio等项目,提供了插件式的能力组件,能更好支持不同用用场景的搭建。

什么是xGPU?

xGPU 是魔搭在创空间上提供的免费 GPU 共享服务,旨在为开发者和研究人员提供托管AI应用服务所需计算资源支持。与传统的云上专属GPU 资源不同,xGPU 通过动态 GPU 分配技术,使多个用户能够共享 GPU 资源,从而实现 GPU 资源的高效利用。基于这样的动态分配技术,使得魔搭社区可以为开发者提供免费的GPU使用,在避免资源浪费的同时,确保更多用户能够访问。

为什么选择 xGPU?

1. 免费,免费,免费!

重要的事情说三遍!是的,xGPU 完全免费!无需任何付费与订阅,GPU 计算能力就直接摆在你面前。无论您是个人开发者,还是创业团队,xGPU 都可以帮您在AI应用开发过程中,节省大量的资源成本。同时您也可以通过魔搭创空间的展示,作为AI应用的展示流量入口。

2. 主流开发生态的无缝衔接,无需代码改动

xGPU兼容常见的各种推理引擎、Python版本。能通过最新的Gradio SDK直接无缝接入,不用担心迁移麻烦。

3. 简单易用的集成方式

想象一下,使用 GPU 不再是一件繁琐的事情。你只需要在魔搭创空间发布过程中,或者配置页面上,选择所需的xGPU 资源即可启用。起来超轻松,还不担心花费!还等什么?速度来薅~

02

xGPU创空间上手指南

是不是已经迫不及待想试试啦,简单几步,就能立刻使用 xGPU:

1.注册魔搭账户:

直达👉 https://www.modelscope.cn/

2.加入xGPU乐园组织:目前xGPU功能处于Beta测试阶段,您可以通过申请加入xGPU乐园组织(https://www.modelscope.cn/organization/xGPU-Explorers),来开启xGPU的使用体验。提交申请审批后,我们会尽快与您沟通申请结果,请及时查收站内信或邮箱。

3.启用 GPU 计算:在新建创空间时,或者编辑已有创空间信息页面,通过选择“空间云资源”,来进行xGPU的资源配置。保存配置后重启即可使用xGPU。当前xGPU的免费算力包括Ada系GPU卡(48G显存)和Tesla系列(16G显存)等GPU类型,更多类型会在后续继续添加

4.发布并运行:一切准备就绪,发布项目,开始享受免费 GPU 资源吧!

当前已经有一系列创空间先行用上了xGPU,您可以在创空间首页点击xGPU,或者直接点击下面链接,就可以查看社区当中搭建的公开xGPU创空间并进行体验。同时xGPU的创空间的空间卡片上,也会有特殊的xGPU的标记,方便您定位xGPU部署的应用。

https://modelscope.cn/studios?page=1&type=interactive-programmatic&xGpu=true

03

xGPU技术实现

xGPU的调度基于阿里云的资源调度和虚拟化技术实现,将多个独立服务,相互隔离地运行在有多个GPU的机器上。基于云上多样化的GPU资源,xGPU提供了根据用户实时请求,进行实时GPU资源调度的能力。每个用户的请求,将会被按需调度到可用的GPU硬件上,并在必要的计算完成之后,迅速触发GPU资源的释放,来满足其他服务请求。

用户的请求进入时,创空间后台服务会针对请求的类型,进行分类的处理。对于非模型推理的请求,基于CPU计算和缓存技术将相关内容返回。模型推理类型请求则会被打上计时标签,并路由到GPU资源池,等待GPU运行后再给出结果。模型运行时可以根据不同因素(包括硬件空闲状态、预定持续时间等)在GPU显存和系统内存中进行交换。在推理类型请求结束后,模型运行时数据被移出GPU显存,将被存储在内存中用于下次GPU处理请求前的初始化,而相应的GPU可以立即被用于处理来自其他创空间的请求。通过这些灵活的自适应调度策略,xGPU能够在相对有限的GPU资源上,支持更多的创空间运行,让GPU资源惠及更多用户。

为了保障资源的高效使用和避免浪费,当前xGPU在使用上,会根据实际资源情况做一些动态限制,包括:

  • 每个开发者基于xGPU能够创建的创空间有数量上限。同时高档的GPU免费使用时长和准入条件的控制,会更加严格。建议您在满足应用运行要求的情况下,基于“够用”的原则来选择xGPU的GPU卡型。
  • 为保障资源使用的公平性,让更多用户来体验创空间应用,每个用户体验xGPU的时长有上限。
  • 您也可以通过降低每次请求的耗时,以提高请求被调度的成功率。
  • 在低频时段或较少用户访问的情况下,创空间将会自动休眠释放资源。

04

What's Next

1、扩大创空间xGPU上的开源SDK支持范围。当前xGPU率先支持了基于Gradio SDK开发的AI应用。后续将陆续引入Streamlit 等其他优秀开源生态支持。

2、引入更多优质的官方xGPU创空间,方便社区开发者交流体验.

3、增加xGPU平台资源弹性能力支持。平台将持续增强弹性资源扩展能力,提升支持的创空间规模,并进一步通过技术手段,降低用户等待时延,提升用户体验。

自从xGPU上线以来,我们已经看到第一批尝鲜使用的AI应用开发者,已经迅速达成GPU自由:

立即加入ModelScope社区的xGPU 乐园吧,让我们共同探索 AI 应用的无限可能性!未来的 AI 应用开发,你就是主角!

相关文档:

创空间概述:

https://www.modelscope.cn/docs/%E5%88%9B%E7%A9%BA%E9%97%B4%E4%BB%8B%E7%BB%8D

xGPU介绍:

https://www.modelscope.cn/docs/xGPU%E5%88%9B%E7%A9%BA%E9%97%B4%E4%BB%8B%E7%BB%8D


点击链接👇,直达更多xGPU详情

https://www.modelscope.cn/docs/xGPU%E5%88%9B%E7%A9%BA%E9%97%B4%E4%BB%8B%E7%BB%8D?from=alizishequ__text

相关文章
|
23天前
|
弹性计算 人工智能 架构师
阿里云携手Altair共拓云上工业仿真新机遇
2024年9月12日,「2024 Altair 技术大会杭州站」成功召开,阿里云弹性计算产品运营与生态负责人何川,与Altair中国技术总监赵阳在会上联合发布了最新的“云上CAE一体机”。
阿里云携手Altair共拓云上工业仿真新机遇
|
15天前
|
存储 关系型数据库 分布式数据库
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
本文介绍了如何使用PolarDB、通义千问和LangChain搭建GraphRAG系统,结合知识图谱和向量检索提升问答质量。通过实例展示了单独使用向量检索和图检索的局限性,并通过图+向量联合搜索增强了问答准确性。PolarDB支持AGE图引擎和pgvector插件,实现图数据和向量数据的统一存储与检索,提升了RAG系统的性能和效果。
|
20天前
|
机器学习/深度学习 算法 大数据
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
2024“华为杯”数学建模竞赛,对ABCDEF每个题进行详细的分析,涵盖风电场功率优化、WLAN网络吞吐量、磁性元件损耗建模、地理环境问题、高速公路应急车道启用和X射线脉冲星建模等多领域问题,解析了问题类型、专业和技能的需要。
2572 22
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
|
18天前
|
人工智能 IDE 程序员
期盼已久!通义灵码 AI 程序员开启邀测,全流程开发仅用几分钟
在云栖大会上,阿里云云原生应用平台负责人丁宇宣布,「通义灵码」完成全面升级,并正式发布 AI 程序员。
|
3天前
|
JSON 自然语言处理 数据管理
阿里云百炼产品月刊【2024年9月】
阿里云百炼产品月刊【2024年9月】,涵盖本月产品和功能发布、活动,应用实践等内容,帮助您快速了解阿里云百炼产品的最新动态。
阿里云百炼产品月刊【2024年9月】
|
2天前
|
存储 人工智能 搜索推荐
数据治理,是时候打破刻板印象了
瓴羊智能数据建设与治理产品Datapin全面升级,可演进扩展的数据架构体系为企业数据治理预留发展空间,推出敏捷版用以解决企业数据量不大但需构建数据的场景问题,基于大模型打造的DataAgent更是为企业用好数据资产提供了便利。
159 2
|
19天前
|
机器学习/深度学习 算法 数据可视化
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
2024年中国研究生数学建模竞赛C题聚焦磁性元件磁芯损耗建模。题目背景介绍了电能变换技术的发展与应用,强调磁性元件在功率变换器中的重要性。磁芯损耗受多种因素影响,现有模型难以精确预测。题目要求通过数据分析建立高精度磁芯损耗模型。具体任务包括励磁波形分类、修正斯坦麦茨方程、分析影响因素、构建预测模型及优化设计条件。涉及数据预处理、特征提取、机器学习及优化算法等技术。适合电气、材料、计算机等多个专业学生参与。
1570 16
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
|
21天前
|
编解码 JSON 自然语言处理
通义千问重磅开源Qwen2.5,性能超越Llama
击败Meta,阿里Qwen2.5再登全球开源大模型王座
944 14
|
3天前
|
Linux 虚拟化 开发者
一键将CentOs的yum源更换为国内阿里yum源
一键将CentOs的yum源更换为国内阿里yum源
187 2
|
16天前
|
人工智能 开发框架 Java
重磅发布!AI 驱动的 Java 开发框架:Spring AI Alibaba
随着生成式 AI 的快速发展,基于 AI 开发框架构建 AI 应用的诉求迅速增长,涌现出了包括 LangChain、LlamaIndex 等开发框架,但大部分框架只提供了 Python 语言的实现。但这些开发框架对于国内习惯了 Spring 开发范式的 Java 开发者而言,并非十分友好和丝滑。因此,我们基于 Spring AI 发布并快速演进 Spring AI Alibaba,通过提供一种方便的 API 抽象,帮助 Java 开发者简化 AI 应用的开发。同时,提供了完整的开源配套,包括可观测、网关、消息队列、配置中心等。
711 10