官方博客-第13页-阿里云开发者社区

望雲十雨言澈

2025-04-10

559

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

559

阿里云云原生

2025-05-12

1011

如何在通义灵码里使用 MCP 能力

通义灵码支持MCP工具使用，通过模型自主规划实现工具调用，深度集成魔搭MCP广场，涵盖2400+热门服务。提供STDIO和SSE两种通信模式，适用于不同场景需求。用户可通过智能体模式调用MCP工具，完成如网页内容抓取、天气查询等任务。文档详细介绍了服务配置、使用流程及常见问题解决方法，助力开发者高效拓展AI编码能力。

阿里云云原生

1,011

澄潭钰诚

2024-07-19

21946

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

Higress 最新的 1.4 版本基于为通义千问，以及多家云上 AGI 厂商客户提供 AI 网关的积累沉淀，开源了大量 AI 原生的网关能力。同时也在 Ingress、可观测、流控等云原生能力上做了全方位升级。

澄潭钰诚

21,946

阿里云云原生

2024-09-23

1122

重磅！阿里云可观测产品家族全新升级，AI +数据双驱动，打造全栈可观测体系

近日，阿里云可观测产品家族正式发布云监控 2.0，隶属产品日志服务 SLS、云监控 CMS、应用实时监控服务 ARMS 迎来重磅升级。

阿里云云原生

1,122

羽沐

2024-12-13

1980

动态链接的魔法：Linux下动态链接库机制探讨

本文将深入探讨Linux系统中的动态链接库机制，这其中包括但不限于全局符号介入、延迟绑定以及地址无关代码等内容。

羽沐

1,980

羿莉

2025-01-14

673

网络安全视角：从地域到账号的阿里云日志审计实践

日志审计的必要性在于其能够帮助企业和组织落实法律要求，打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用，一方面是选择国家网络安全专用认证的日志分析产品，另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外，还可通过报表分析和告警配置，主动发现潜在的安全威胁，增强云上资产安全。

羿莉

673

丕天

2025-03-21

1132

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,132

任庆盛

2023-02-22

23172

Flink CDC+Kafka 加速业务实时化

阿里巴巴开发工程师，Apache Flink Committer 任庆盛，在 9 月 24 日 Apache Flink Meetup 的分享。

任庆盛

23,172

ModelScope

2024-05-15

1155

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,155

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

AI Infra之模型显存管理分析

如何在通义灵码里使用 MCP 能力

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

重磅！阿里云可观测产品家族全新升级，AI +数据双驱动，打造全栈可观测体系

动态链接的魔法：Linux下动态链接库机制探讨

网络安全视角：从地域到账号的阿里云日志审计实践

AI 推理场景的痛点和解决方案

Flink CDC+Kafka 加速业务实时化

vLLM部署Yuan2.0：高吞吐、更便捷

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI Infra之模型显存管理分析

如何在通义灵码里使用 MCP 能力

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

重磅！阿里云可观测产品家族全新升级，AI +数据双驱动，打造全栈可观测体系

动态链接的魔法：Linux下动态链接库机制探讨

网络安全视角：从地域到账号的阿里云日志审计实践

AI 推理场景的痛点和解决方案

Flink CDC+Kafka 加速业务实时化

vLLM部署Yuan2.0：高吞吐、更便捷