官方博客-第10页-阿里云开发者社区

阿里云云原生

2024-05-16

57772

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

57,772

阿里云云原生

2024-08-26

909

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力

本⽂对 Prompt 的使用方式进行了简单介绍，让大家了解到 Prompt 对于 LLM 的重要性。并尝试在 Prompt 中结合用户 Geo IP 信息，实现 LLM 的个性化回复，提升问答的准确度。

阿里云云原生

909

砚染

2024-09-03

2393

速成RAG+Agent框架大模型应用搭建

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用。

砚染

2,393

望宸

2025-02-20

1466

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

1,466

望雲十雨言澈

2025-04-10

1314

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

1,314

孤弋正己

2025-05-29

4097

本文深入探讨了Model Context Protocol (MCP) 在企业级环境中的部署与管理挑战，详细解析了五种主流MCP架构模式（直连远程、代理连接远程、直连本地、本地代理连接本地、混合模式）的优缺点及适用场景，并结合Nacos服务治理框架，提供了实用的企业级MCP部署指南。通过Nacos MCP Router，实现MCP服务的统一管理和智能路由，助力金融、互联网、制造等行业根据数据安全、性能需求和扩展性要求选择合适架构。文章还展望了MCP在企业落地的关键方向，包括中心化注册、软件供应链控制和安全访问等完整解决方案。

孤弋正己

4,097

阿里云云原生

2024-05-15

94539

当 OpenTelemetry 遇上阿里云 Prometheus

本文以构建系统可观测为切入点，对比 OpenTelemetry 与 Prometheus 的相同与差异，重点介绍如何将应用的 OpenTelemetry 指标接入 Prometheus 及背后原理以及介绍阿里云可观测监控 Prometheus 版拥抱 OpenTelemetry及相关落地实践案例。

阿里云云原生

94,539

灵杰开发者

2025-08-08

1125

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

1,125

ModelScope

2024-05-15

1677

快来与 CodeQwen1.5 结对编程

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

ModelScope

1,677

官方博客-第10页-阿里云开发者社区

类目筛选

内容类型

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力

速成RAG+Agent框架大模型应用搭建

大模型推理服务全景图

AI Infra之模型显存管理分析

MCP Server的五种主流架构与Nacos的选择

当 OpenTelemetry 遇上阿里云 Prometheus

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

快来与 CodeQwen1.5 结对编程

官方博客-第10页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力

速成RAG+Agent框架大模型应用搭建

大模型推理服务全景图

AI Infra之模型显存管理分析

MCP Server的五种主流架构与Nacos的选择

当 OpenTelemetry 遇上阿里云 Prometheus

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

快来与 CodeQwen1.5 结对编程