ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

354

继儒

2023-03-21

2232

Hologres技术揭秘，JSON半结构化数据的极致分析性能

本文将会揭秘Hologres JSONB半结构化数据的技术原理，实现JSON半结构数据的极致分析性能。

继儒

2,232

弃余

2023-08-11

798

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

798

阿里云大数据Al技术

2024-05-15

144797

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

本教程将带领大家免费领取阿里云PAI-EAS的免费试用资源，并且带领大家在 ComfyUI 环境下使用 SVD的模型，根据任何图片生成一个小短视频。

阿里云大数据Al技术

144,797

烨陌

2024-05-15

179

基于SLS平台与日志审计构建Cloud SIEM方案

安全事件和事件管理（security information and event management，SIEM）通过对来自各种数据源安全事件的收集和分析，来实现威胁检测、安全事件管理和合规性检测。SIEM是在安全信息管理(SIM)——收集、分析并报告日志数据，与安全事件管理(SEM)——实时分析日志和事件数据以提供威胁监视、事件关联和事件响应的基础上发展而来的。本文为您介绍如何基于SLS平台与日志审计构建Cloud SIEM方案。

烨陌

179

阿里云实时计算Flink

2023-03-30

4464

Apache Paimon 在同程旅行的探索实践

本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。

阿里云实时计算Flink

4,464

斜阳

2024-05-15

132432

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

132,432

ModelScope

2024-05-15

108842

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

108,842

ModelScope

2024-05-15

103430

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

103,430

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

Hologres技术揭秘，JSON半结构化数据的极致分析性能

Linux 内存管理新特性：Memory folios 解读

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

基于SLS平台与日志审计构建Cloud SIEM方案

Apache Paimon 在同程旅行的探索实践

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

手把手教你捏一个自己的Agent