Serverless 应用引擎常见问题之AI应用限制人为限制内存如何解决

简介: Serverless 应用引擎(Serverless Application Engine, SAE)是一种完全托管的应用平台,它允许开发者无需管理服务器即可构建和部署应用。以下是Serverless 应用引擎使用过程中的一些常见问题及其答案的汇总:

问题一:PolarDB的Serverless版支持x-engine引擎吗?


PolarDB的Serverless版支持x-engine引擎吗?


参考回答:

目前功能开发完了,下个版本可以开。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/602205


问题二:polarDB serverless弹性上线最大是17核,这个增量嘛?


polarDB serverless弹性上线最大是17核,这个增量嘛?比如现在是64核,可以弹到81核?



参考回答:

最大16核,是增量。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/602168


问题三:阿里云ASK 的ack serverless 支持Pod显存设置吗?


阿里云ASK 的ack serverless 支持Pod显存设置吗?还是目前仅支持单张GPU,文档里面好像没有相关描述


参考回答:

阿里云的ACK Serverless(ASK)支持设置Pod显存,并且支持多张GPU

首先,关于Pod显存设置的问题,虽然文档中可能没有明确说明Pod级别的显存设置,但是考虑到ACK Serverless基于ECI(弹性容器实例),它确实支持了GPU容器实例。这意味着用户可以利用ECI服务在ACK Serverless集群中部署需要GPU资源的容器应用,并按需使用GPU计算资源。

进一步来说,ECI GPU支持的驱动版本为NVIDIA 460.73.01,且支持CUDA Toolkit版本为11.2。这为用户提供了在ACK Serverless集群中使用GPU的能力,尤其是在进行AI计算任务时可以显著提升计算效率。而且,ECI支持通过指定ECS GPU规格来创建ECI GPU实例,这表明用户可以根据需要选择不同规格的GPU资源,从而间接实现Pod显存的设置。

总结而言,尽管文档中可能未详细描述Pod级别的显存配置,但通过ECI GPU实例的支持,用户仍然可以在ACK Serverless集群中根据需求部署和管理具有GPU资源的容器,实现高效灵活的计算任务执行。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/602111


问题四:函数计算中serverless的AI应用可以限制人为限制内存吗?只在函数式那边看到内存的分配...


函数计算中serverless的AI应用可以限制人为限制内存吗?只在函数式那边看到内存的分配...


参考回答:

做个任务分配,然后预先创建不同规格的函数。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/601932


问题五:函数计算FC的Serverless API 支持模型训练的操作吗?对应的接口文档有嘛?


函数计算FC的Serverless API 支持模型训练的操作吗?对应的接口文档有嘛?


参考回答:

也是支持训练的,跟webui的原生api接口相同,不过还是推荐使用原生的webui-api进行训练。 https://developer.aliyun.com/article/1429825#slide-6 , 其他文档中不存在的接口同webui-api接口(/docs)。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/601863

相关实践学习
SAE 极速部署专属AI证件照神器
本实验带您体验在SAE快速部署一套自己专用的AI 证件照神器。使用SAE部署应用,您无需长期租用服务器,SAE允许在不使用时实例缩容为零,不产生费用。
相关文章
|
5月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
655 30
|
5月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
663 2
|
5月前
|
消息中间件 人工智能 安全
构建企业级 AI 应用:为什么我们需要 AI 中间件?
阿里云发布AI中间件,涵盖AgentScope-Java、AI MQ、Higress、Nacos及可观测体系,全面开源核心技术,助力企业构建分布式多Agent架构,推动AI原生应用规模化落地。
583 0
构建企业级 AI 应用:为什么我们需要 AI 中间件?
|
5月前
|
人工智能 安全 Serverless
再看 AI 网关:助力 AI 应用创新的关键基础设施
AI 网关作为云产品推出已有半年的时间,这半年的时间里,AI 网关从内核到外在都进行了大量的进化,本文将从 AI 网关的诞生、AI 网关的产品能力、AI 网关的开放生态,以及新推出的 Serverless 版,对其进行一个全面的介绍,期望对正在进行 AI 应用落地的朋友,在 AI 基础设施选型方面提供一些参考。
1051 77
|
5月前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
932 20
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
|
5月前
|
人工智能 安全 数据可视化
Dify让你拖拽式搭建企业级AI应用
Dify是开源大模型应用开发平台,融合BaaS与LLMOps理念,通过可视化工作流、低代码编排和企业级监控,支持多模型接入与RAG知识库,助力企业快速构建安全可控的AI应用,实现从原型到生产的高效落地。
Dify让你拖拽式搭建企业级AI应用
|
5月前
|
自然语言处理 数据挖掘 关系型数据库
ADB AI指标分析在广告营销场景的方案及应用
ADB Analytic Agent助力广告营销智能化,融合异动与归因分析,支持自然语言输入、多源数据对接及场景模板化,实现从数据获取到洞察报告的自动化生成,提升分析效率与精度,推动数据驱动决策。
|
8月前
|
存储
阿里云轻量应用服务器收费标准价格表:200Mbps带宽、CPU内存及存储配置详解
阿里云香港轻量应用服务器,200Mbps带宽,免备案,支持多IP及国际线路,月租25元起,年付享8.5折优惠,适用于网站、应用等多种场景。
2750 0
|
8月前
|
存储 缓存 NoSQL
内存管理基础:数据结构的存储方式
数据结构在内存中的存储方式主要包括连续存储、链式存储、索引存储和散列存储。连续存储如数组,数据元素按顺序连续存放,访问速度快但扩展性差;链式存储如链表,通过指针连接分散的节点,便于插入删除但访问效率低;索引存储通过索引表提高查找效率,常用于数据库系统;散列存储如哈希表,通过哈希函数实现快速存取,但需处理冲突。不同场景下应根据访问模式、数据规模和操作频率选择合适的存储结构,甚至结合多种方式以达到最优性能。掌握这些存储机制是构建高效程序和理解高级数据结构的基础。
894 1

热门文章

最新文章

相关产品

  • 函数计算
  • Serverless 应用引擎