官方博客-第14页-阿里云开发者社区

雨鸦

2024-12-27

1555

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,555

望雲十雨言澈

2025-04-10

559

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

559

ModelScope

2024-05-15

1156

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,156

澄潭钰诚

2024-07-19

21946

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

Higress 最新的 1.4 版本基于为通义千问，以及多家云上 AGI 厂商客户提供 AI 网关的积累沉淀，开源了大量 AI 原生的网关能力。同时也在 Ingress、可观测、流控等云原生能力上做了全方位升级。

澄潭钰诚

21,946

龙蜥社区OpenAnolis

2024-11-06

2922

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

机密计算软硬结合技术保障数据安全。

龙蜥社区OpenAnolis

2,922

ModelScope

2025-06-16

545

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

545

张佐玮

2023-12-01

1546

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

1,546

阿里云云原生

2024-05-24

47967

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

使用阿里云函数计算FC，快速部署AI绘画工具ComfyUI，体验高质量图像生成。新用户可享180元试用额度，包括GPU、vCPU、内存和调用次数。开通FC和文件存储NAS，通过应用中心选择ComfyUI模板创建应用。

阿里云云原生

47,967

古琦

2024-07-04

109501

全链路追踪 & 性能监控，GO 应用可观测全面升级

当前，大多数面向 Golang 应用的监控能力主要是通过 SDK 方式接入，需要开放人员手动进行埋点，会存在一定问题。对此，可观测 Go Agent 应运而生。本文介绍的阿里云可观测 Go Agent 方案，能通过无侵入的方式实现应用监控能力。

古琦

109,501

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

极简开发，极速上线：构建端到端大模型应用

AI Infra之模型显存管理分析

vLLM部署Yuan2.0：高吞吐、更便捷

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

Koordinator 助力云原生应用性能提升，小红书混部技术实践

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

全链路追踪 & 性能监控，GO 应用可观测全面升级

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

极简开发，极速上线：构建端到端大模型应用

AI Infra之模型显存管理分析

vLLM部署Yuan2.0：高吞吐、更便捷

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

Koordinator 助力云原生应用性能提升，小红书混部技术实践

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

全链路追踪 & 性能监控，GO 应用可观测全面升级