官方博客-第22页-阿里云开发者社区

ModelScope

2024-05-15

1170

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,170

ModelScope

2024-05-15

1144

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,144

古琦

2024-07-04

109513

全链路追踪 & 性能监控，GO 应用可观测全面升级

当前，大多数面向 Golang 应用的监控能力主要是通过 SDK 方式接入，需要开放人员手动进行埋点，会存在一定问题。对此，可观测 Go Agent 应运而生。本文介绍的阿里云可观测 Go Agent 方案，能通过无侵入的方式实现应用监控能力。

古琦

109,513

寻剑

2024-09-11

343

表格存储低成本向量检索服务助力 AI 检索

本文阐述了阿里云表格存储（Tablestore）如何通过其向量检索服务应对大规模数据检索的需求，尤其是在成本、规模和召回率这三个关键挑战方面。

寻剑

343

阿里云云原生

2025-01-15

170

阿里云可观测 2024 年 12 月产品动态

阿里云可观测 2024 年 12 月产品动态。

阿里云云原生

170

橙唯

2025-02-21

913

基于LLM打造沉浸式3D世界

阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索，为了解决LLMs与3D结合的问题，近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案，通过自然语言来与引擎内的3D世界进行交互。

橙唯

913

望雲十雨言澈

2025-04-10

572

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

572

阿里云云原生

2025-05-16

660

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

为了展现 LoongCollector 的卓越性能，本文通过纵向（LoongCollector 与 iLogtail 产品升级对比）和横向（LoongCollector 与其他开源日志采集 Agent 对比）两方面对比，深度测评不同采集 Agent 在常见的日志采集场景下的性能。

阿里云云原生

660

周宇睿

2023-09-08

738

MaxCompute半结构化数据思考与创新

本文将介绍MaxCompute在半结构化数据方面的一些思考与创新，围绕半结构化数据简析、传统方案优劣对比、MaxCompute半结构化数据解决方案、收益分析。

周宇睿

738

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

全链路追踪 & 性能监控，GO 应用可观测全面升级

表格存储低成本向量检索服务助力 AI 检索

阿里云可观测 2024 年 12 月产品动态

基于LLM打造沉浸式3D世界

AI Infra之模型显存管理分析

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

MaxCompute半结构化数据思考与创新

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

全链路追踪 & 性能监控，GO 应用可观测全面升级

表格存储低成本向量检索服务助力 AI 检索

阿里云可观测 2024 年 12 月产品动态

基于LLM打造沉浸式3D世界

AI Infra之模型显存管理分析

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

MaxCompute半结构化数据思考与创新