官方博客-第18页-阿里云开发者社区

阿里云云原生

2024-10-18

958

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

958

阿里云云原生

2024-11-04

646

只要几句话，通义灵码帮你创建专属健康管理小程序

数字时代的大潮中，编程不再高深莫测，而是每个人都可以尝试并享受的乐趣。今天，就让我们一起探索如何利用通义灵码的自然语言生成代码功能，轻松打造你的专属健康管理小程序，说不定在这个过程中，不管是身材管理，还是编程学习，都能让你离目标更近一步。

阿里云云原生

646

探索云世界

2025-01-02

375

云端问道11期实践教学-创建专属AI助手

本次分享意在帮助用户更加全面、深入地了解百炼的核心产品能力，并通过实际操作学会如何快速将大模型与自己的系统及应用相结合。主要包括以下三个方面： 1. 阿里云百炼产品定位和能力简介 2. 知识检索 RAG 智能体应用能力和优势 3. 最佳落地案例实践分享

探索云世界

375

言澈

2025-02-28

1157

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,157

荣阳

2025-02-28

1020

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,020

阿里云开发者

2025-04-24

1121

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,121

ModelScope

2025-06-16

496

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

496

阿里云云原生

2025-06-30

405

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

405

查斌

2023-04-14

577

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

Nydus+Dragonfly 组合减少容器启动过程中镜像的拉取时间，提升集群间的镜像分发效率。

查斌

577

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

只要几句话，通义灵码帮你创建专属健康管理小程序

云端问道11期实践教学-创建专属AI助手

进行GPU算力管理

使用A10单卡24G复现DeepSeek R1强化学习过程

为什么一定要做Agent智能体？

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

只要几句话，通义灵码帮你创建专属健康管理小程序

云端问道11期实践教学-创建专属AI助手

进行GPU算力管理

使用A10单卡24G复现DeepSeek R1强化学习过程

为什么一定要做Agent智能体？

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案