阿里云云原生

2024-05-22

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

超算快速弹性伸缩场景下，如何构建一套准确、快速、可靠的监控体系成为关键点。阿里云在超算场景的主机监控落地实践，解决超算场景面临的挑战，交付一套可靠和全面的主机监控体系。

阿里云云原生

60,082

喻奎

2023-06-25

10075

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,075

ModelScope

2024-05-15

372

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

372

文婷

2024-06-04

71772

ApsaraMQ Copilot for RocketMQ：消息数据集成链路的健康管家

阿里云消息队列 ApsaraMQ 始终围绕“高弹性低成本、更稳定更安全、智能化免运维”三大核心方向进行演进和拓展。在智能化免运维方面，通过 ApsaraMQ Copilot，为企业提供消息数据集成链路的健康管家，让消息服务走进智能化免运维的新时代。

文婷

71,772

启淮凡问

2024-07-16

11711

从一个服务预热不生效问题谈微服务无损上线

本文基于阿里云技术服务团队和产研团队，在解决易易互联使用 MSE（微服务引擎）产品无损上线功能所遇到问题的过程总结而成。本文将从问题和解决方法谈起，再介绍相关原理，后进一步拓展到对微服务引擎和云原生网关无损上线能力的介绍。

启淮凡问

11,711

弃余

2023-08-11

810

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

810

王骜

2024-05-15

164916

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

164,916

ModelScope

2024-05-15

401

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

401

仲阳

2024-06-13

14054

阿里云运维第一步（监控）：开箱即用的监控

监控运维是一个体系化的工作，完善这个体系非一日之功。但是我们的业务不可一日无监控“裸奔”，在阿里云怎么样快速低成本的建立第一道资源监控的护城河？开箱即用的云监控，将会是你进入阿里云的第一个可靠的小伙伴。

仲阳

14,054

类目筛选

内容类型

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

MaxCompute湖仓一体近实时增量处理技术架构揭秘

vLLM部署Yuan2.0：高吞吐、更便捷

ApsaraMQ Copilot for RocketMQ：消息数据集成链路的健康管家

从一个服务预热不生效问题谈微服务无损上线

Linux 内存管理新特性：Memory folios 解读

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

元象大模型开源30款量化版本加速低成本部署丨附教程

阿里云运维第一步（监控）：开箱即用的监控

类目筛选

内容类型

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

MaxCompute湖仓一体近实时增量处理技术架构揭秘

vLLM部署Yuan2.0：高吞吐、更便捷

ApsaraMQ Copilot for RocketMQ：消息数据集成链路的健康管家

从一个服务预热不生效问题谈微服务无损上线

Linux 内存管理新特性：Memory folios 解读

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

元象大模型开源30款量化版本 加速低成本部署丨附教程

阿里云运维第一步（监控）：开箱即用的监控

元象大模型开源30款量化版本加速低成本部署丨附教程