官方博客-第22页-阿里云开发者社区

柯灵

2025-03-11

1656

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,656

阿里云云原生

2024-05-15

136186

云原生场景下，AIGC 模型服务的工程挑战和应对

本文介绍了在云原生场景下，AIGC 模型服务的工程挑战和Fluid 在云原生 AIGC 模型推理场景的优化。

阿里云云原生

136,186

CloudImagine

2024-05-15

601

AIGC下一步：用AI再度重构或优化媒体处理

LiveVideoStackCon2023深圳站，阿里云视频云演讲分享

CloudImagine

601

阿里云云原生

2024-10-18

1046

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

1,046

霜序

2025-01-20

649

ACK 容器监控存储全面更新：让您的应用运行更稳定、更透明

针对本地存储和 PVC 这两种容器存储使用方式，我们对 ACK 的容器存储监控功能进行了全新升级。此次更新完善了对集群中不同存储类型的监控能力，不仅对之前已有的监控大盘进行了优化，还针对不同的云存储类型，上线了全新的监控大盘，确保用户能够更好地理解和管理容器业务应用的存储资源。

霜序

649

亦达

2025-02-20

800

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

800

阿里云云原生

2025-04-28

813

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

813

林以琳

2024-05-15

1018

基于PAI-DSW快速启动Stable Diffusion WebUI

基于PAI-DSW快速启动Stable Diffusion WebUI，创作你的专属冬日主题AI画作！

林以琳

1,018

奶司

2024-05-15

1171

人人都是AI大师 - Prompt工程

prompt工程不需要复杂的编程知识，人人都可以使用prompt工程成为AI大师。本文只探讨prompt工程，不涉及模型训练等内容。只讨论文本生成，不涉及图像等领域。

奶司

1,171

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

云原生场景下，AIGC 模型服务的工程挑战和应对

AIGC下一步：用AI再度重构或优化媒体处理

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

ACK 容器监控存储全面更新：让您的应用运行更稳定、更透明

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

基于PAI-DSW快速启动Stable Diffusion WebUI

人人都是AI大师 - Prompt工程

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

云原生场景下，AIGC 模型服务的工程挑战和应对

AIGC下一步：用AI再度重构或优化媒体处理

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

ACK 容器监控存储全面更新：让您的应用运行更稳定、更透明

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

基于PAI-DSW快速启动Stable Diffusion WebUI

人人都是AI大师 - Prompt工程