ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

355

ModelScope

2024-05-15

108843

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

108,843

ModelScope

2024-05-15

103431

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

103,431

斜阳

2024-05-15

132432

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

132,432

阿里云网络

2023-07-12

606

阿里云飞天洛神云网络集中式网关ACMG最佳实践

云网络集中式网关ACMG的实践

阿里云网络

606

栾枝

2023-07-18

130455

手把手教你使用OSS-HDFS服务平替自建HDFS

本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

栾枝

130,455

山泽

2024-05-15

302

从零构建现代深度学习框架(TinyDL-0.01)

本文主要以一个Java工程师视角，阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架（类比AI的操作系统）。

山泽

302

晴筱石超张小路

2023-07-04

151277

阿里云块存储团队软件工程实践

文本主要介绍阿里云块存储团队同学们的踩坑经验，总结成案例和方法分享公示，实践和方法论不限于分布式系统。

晴筱石超张小路等

151,277

阿里云存储

2024-05-15

94847

AIGC训练场景下的存储特征研究

在今天这样以AIGC为代表的AI时代下，了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告，来看看AIGC对于存储有哪些具体的性能要求。

阿里云存储

94,847

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

手把手教你捏一个自己的Agent

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

阿里云飞天洛神云网络集中式网关ACMG最佳实践

手把手教你使用OSS-HDFS服务平替自建HDFS

从零构建现代深度学习框架(TinyDL-0.01)

阿里云块存储团队软件工程实践

AIGC训练场景下的存储特征研究