官方博客-第15页-阿里云开发者社区

ModelScope

2024-05-15

1170

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,170

探索云世界

2024-05-15

1552

3步教你在云服务器上做Github DevOps部署

本文指导您使用阿里云DevOps工具云效，将Github中托管的代码部署在云服务器ECS中，使得用户能够在互联网公网中访问个人应用服务。文章来自云服务器ECS开发实践征文活动用户投稿，已获得作者（昵称秋天）授权发布。

探索云世界

1,552

ModelScope

2024-05-15

1144

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,144

景祁

2024-05-15

164512

设计与构建 FinOps 流程、团队、体系与目标

企业 FinOps 实施不是一蹴而就的项目，如果您正在推进企业云原生 FinOps 落地，除了选择合适的技术手段，企业内部的流程和体系建设也尤为重要。

景祁

164,512

寻剑

2024-09-11

343

表格存储低成本向量检索服务助力 AI 检索

本文阐述了阿里云表格存储（Tablestore）如何通过其向量检索服务应对大规模数据检索的需求，尤其是在成本、规模和召回率这三个关键挑战方面。

寻剑

343

羿莉

2024-11-26

743

随着企业对云服务的广泛应用，数据安全成为重要课题。通过对云上数据进行敏感数据扫描和保护，可以有效提升企业或组织的数据安全。本文主要基于阿里云的数据安全中心数据识别功能进行深入实践探索。通过对商品购买日志的模拟，分析了如何使用阿里云的工具对日志数据进行识别、脱敏（3 种模式）处理和基于 StoreView 的查询脱敏方式，从而在保障数据安全的同时满足业务需求。通过这些实践，企业可以有效降低数据泄漏风险，提升数据治理能力和系统安全性。

羿莉

743

乘凨

2024-11-29

506

写了BUG还想跑——闲鱼异常日志问题自动追踪-定位-分发机制

为了高效地发现、定位和解决预发问题，闲鱼团队研发了一套异常日志问题自动追踪-定位-分发机制。这套机制通过自动化手段，实现了异常日志的定时扫描、精准定位和自动分发，显著降低了开发和测试的成本，提高了问题解决的效率。

乘凨

506

橙唯

2025-02-21

913

基于LLM打造沉浸式3D世界

阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索，为了解决LLMs与3D结合的问题，近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案，通过自然语言来与引擎内的3D世界进行交互。

橙唯

913

望雲十雨言澈

2025-04-10

572

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

572

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

3步教你在云服务器上做Github DevOps部署

LISA微调技术解析：比LoRA更低的显存更快的速度

设计与构建 FinOps 流程、团队、体系与目标

表格存储低成本向量检索服务助力 AI 检索

云上数据安全保护：敏感日志扫描与脱敏实践详解

写了BUG还想跑——闲鱼异常日志问题自动追踪-定位-分发机制

基于LLM打造沉浸式3D世界

AI Infra之模型显存管理分析

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

3步教你在云服务器上做Github DevOps部署

LISA微调技术解析：比LoRA更低的显存更快的速度

设计与构建 FinOps 流程、团队、体系与目标

表格存储低成本向量检索服务助力 AI 检索

云上数据安全保护：敏感日志扫描与脱敏实践详解

写了BUG还想跑——闲鱼异常日志问题自动追踪-定位-分发机制

基于LLM打造沉浸式3D世界

AI Infra之模型显存管理分析