ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

357

斜阳

2024-05-15

132436

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

132,436

ModelScope

2024-05-15

103435

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

103,435

涯海

2024-05-15

159

链路追踪（Tracing）其实很简单——链路成本进阶指南

广义上的链路成本，既包含使用链路追踪产生的数据生成、采集、计算、存储、查询等额外资源开销，也包含链路系统接入、变更、维护、协作等人力运维成本。为了便于理解，本小节将聚焦在狭义上的链路追踪机器资源成本，人力成本将在下一小节（效率）进行介绍。

涯海

159

阿里云存储

2024-05-15

94852

AIGC训练场景下的存储特征研究

在今天这样以AIGC为代表的AI时代下，了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告，来看看AIGC对于存储有哪些具体的性能要求。

阿里云存储

94,852

阿里云瑶池数据库

2024-07-18

63

Redis Proxy RT上升后连接倾斜

本文细致地描述了关于Redis Proxy RT上升后连接倾斜问题的排查过程和根本原因，最后给出了优化方案。

阿里云瑶池数据库

63

弃余

2023-08-11

799

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

799

阿里云PolarDB

2024-05-15

112788

PolarDB-X最佳实践系列（三）：如何实现高效的分页查询

分页查询是数据库中常见的操作。本文将介绍，如何在数据库中（无论是单机还是分布式）高效的进行翻页操作。

阿里云PolarDB

112,788

轮子

2024-05-15

129

基于图数据库搭建企业级的推荐类系统

本文为您介绍基于专有云敏捷版数据库场景DBStack和图数据库搭建企业级推荐类系统。

轮子

129

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

手把手教你捏一个自己的Agent

链路追踪（Tracing）其实很简单——链路成本进阶指南

AIGC训练场景下的存储特征研究

Redis Proxy RT上升后连接倾斜

Linux 内存管理新特性：Memory folios 解读

PolarDB-X最佳实践系列（三）：如何实现高效的分页查询

基于图数据库搭建企业级的推荐类系统