官方博客-第25页-阿里云开发者社区

ModelScope

2024-05-15

1127

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,127

ModelScope

2024-05-15

1107

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,107

赵世振

2024-08-21

1443

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用阿里云百炼平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用阿里云百炼的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

1,443

喻奎

2024-08-23

284

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

本文主要介绍基于 MaxCompute 的离线近实时一体化新架构如何来支持这些综合的业务场景，提供基于Delta Table的近实时增全量一体的数据存储和计算解决方案。

喻奎

284

布谷

2024-09-03

576

React 的正确使用方法：ref 篇

你真的用对了 useRef 吗？在与 TypeScript 一起使用、以及撰写组件库的情况下，你的写法能够避开以下所有场景的坑吗？

布谷

576

笃敏

2025-03-28

233

架构革新：揭示卓越性能与高可扩展的共赢秘诀

为了构建现代化的可观测数据采集器LoongCollector，iLogtail启动架构通用化升级，旨在提供高可靠、高可扩展和高性能的实时数据采集和计算服务。然而，通用化的过程总会伴随性能劣化，本文重点介绍LoongCollector的性能优化之路，并对通用化和高性能之间的平衡给出见解。

笃敏

233

望雲十雨言澈

2025-04-10

524

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

524

阿里云云原生

2025-08-06

379

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南

JSON 日志因灵活易扩展而广泛应用，但其海量数据也带来分析挑战。本文系统介绍阿里云日志服务（SLS）中处理 JSON 日志的最佳实践，涵盖数据预处理、索引配置、JSON 函数使用及 SQL 智能生成，助你高效挖掘日志价值。

阿里云云原生

379

栾枝

2023-07-18

131006

手把手教你使用OSS-HDFS服务平替自建HDFS

本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

栾枝

131,006

官方博客-第25页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

React 的正确使用方法：ref 篇

架构革新：揭示卓越性能与高可扩展的共赢秘诀

AI Infra之模型显存管理分析

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南

手把手教你使用OSS-HDFS服务平替自建HDFS

官方博客-第25页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

React 的正确使用方法：ref 篇

架构革新：揭示卓越性能与高可扩展的共赢秘诀

AI Infra之模型显存管理分析

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南

手把手教你使用OSS-HDFS服务平替自建HDFS