官方博客-第21页-阿里云开发者社区

阿里云云原生

2025-01-26

1288

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,288

望宸

2025-02-20

687

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

687

言澈

2025-02-28

1217

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,217

望宸魁宇

2025-04-07

445

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

是否还记得 2022 年 K8s Ingress Nginx 披露了的 3 个高危安全漏洞（CVE-2021-25745, CVE-2021-25746, CVE-2021-25748），并在那一年宣布停止接收新功能 PR，专注修复并提升稳定性。

望宸魁宇

445

ModelScope

2025-06-16

571

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

571

阿里云云原生

2025-06-30

445

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

445

弃余

2023-08-11

1561

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

1,561

别梦

2023-08-16

1211

MaxCompute ODPS重装上阵：PIVOT/UNPIVOT

MaxCompute推出新语法 - PIVOT/UNPIVOT：通过PIVOT关键字基于聚合将一个或者多个指定值的行转换为列；通过UNPIVOT关键字可将一个或者多个列转换为行。以更简洁易用的方式满足行转列和列转行的需求，简化了查询语句，提高了广大大数据开发者的生产力。

别梦

1,211

炎火

2024-05-15

1073

安全防御四部曲-防护实践方案（多产品结合）

本篇内容为防护（Protection），检测（Detection），恢复（Recovery），响应（Response）实践方案四部曲之一，主要介绍如何结合多产品使用在阿里云国际站做好防护（Protection）部分的安全。

炎火

1,073

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

最近谈论 SSE 和 WebSocket 的人越来越多的原因

大模型推理服务全景图

进行GPU算力管理

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Linux 内存管理新特性：Memory folios 解读

MaxCompute ODPS重装上阵：PIVOT/UNPIVOT

安全防御四部曲-防护实践方案（多产品结合）

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

最近谈论 SSE 和 WebSocket 的人越来越多的原因

大模型推理服务全景图

进行GPU算力管理

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Linux 内存管理新特性：Memory folios 解读

MaxCompute ODPS重装上阵：PIVOT/UNPIVOT

安全防御四部曲-防护实践方案（多产品结合）