官方博客-第19页-阿里云开发者社区

赫曦

2024-05-15

93226

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,226

ModelScope

2024-05-15

982

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

982

离澈

2024-05-15

399

万字长文：一文详解单元测试干了什么

好的单元测试不仅可以验证代码结构设计的是否合理，而且可以提前发现代码中的漏洞，将线上风险扼杀在摇篮中。本文从常用的单元测试框架出发，对Mockito框架深入浅出的讲解，希望能帮到每一位同学。

离澈

399

ModelScope

2024-05-15

1187

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,187

阿里云瑶池数据库

2024-05-15

71417

数据存储成本飙升，莫慌，RDS数据归档功能来了

一文解锁阿里云RDS数据归档功能。

阿里云瑶池数据库

71,417

宝惜

2024-11-15

516

架构师的真内核

本文旨在帮助大家深入理解技术、架构和团队领导力的本质，从而获得持续成长的方法。欢迎在文末留言，你觉得架构师需要具备的核心能力是什么？

宝惜

516

望宸

2025-02-20

687

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

687

言澈

2025-02-28

1217

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,217

弃余

2023-08-11

1561

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

1,561

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

万字长文：一文详解单元测试干了什么

vLLM部署Yuan2.0：高吞吐、更便捷

数据存储成本飙升，莫慌，RDS数据归档功能来了

架构师的真内核

大模型推理服务全景图

进行GPU算力管理

Linux 内存管理新特性：Memory folios 解读

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

万字长文：一文详解单元测试干了什么

vLLM部署Yuan2.0：高吞吐、更便捷

数据存储成本飙升，莫慌，RDS数据归档功能来了

架构师的真内核

大模型推理服务全景图

进行GPU算力管理

Linux 内存管理新特性：Memory folios 解读