官方博客-第30页-阿里云开发者社区

望雲十雨言澈

2025-04-10

585

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

585

阿里云实时计算Flink

2023-02-21

1016

FlinkSQL 的行级权限解决方案及源码

FlinkSQL的行级权限解决方案及源码，支持面向用户级别的行级数据访问控制，即特定用户只能访问授权过的行，隐藏未授权的行数据。此方案是实时领域Flink的解决方案，类似离线数仓Hive中Ranger Row-level Filter方案。

阿里云实时计算Flink

1,016

阿里云实时计算Flink

2023-04-13

1268

海量数据实时分析引擎 Apache Flink

当系统出现大量或者重大的错误却不被人感知，将会对业务产生影响，从而导致资产损失。当竞争对手实施了新战术，却无法及时感知，跟不上竞争对手的节奏，总是追着对方尾巴走。当要做决策的时候，海量的业务数据增长却无法实时看到聚合结果，决策总是凭借过往经验或者过时的数据分析之上。

阿里云实时计算Flink

1,268

王明橙鲤黄俊

2024-05-15

64144

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,144

ModelScope

2024-05-15

1241

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,241

ModelScope

2024-05-15

1156

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,156

阿里云实时数仓Hologres

2024-06-18

2343

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

2,343

阿里云百炼

2024-07-09

1493

阿里云百炼应用实践系列-基于LlamaIndex的文档问答助手

本文以阿里云百炼官方文档问答助手为例，介绍如何基于阿里云百炼平台打造基于LlamaIndex的RAG文档问答产品。我们基于阿里云百炼平台的底座能力，以官方帮助文档为指定知识库，搭建了问答服务，支持钉钉、Web访问。介绍了相关技术方案和主要代码，供开发者参考。

阿里云百炼

1,493

阿里云实时数仓Hologres

2024-07-23

25246

分析性能提升40%，阿里云Hologres流量场景最佳实践

阿里云实时数仓Hologres

25,246

官方博客-第30页-阿里云开发者社区

类目筛选

内容类型

AI Infra之模型显存管理分析

FlinkSQL 的行级权限解决方案及源码

海量数据实时分析引擎 Apache Flink

通义千问开源模型在PAI灵骏的最佳实践

元象大模型开源30款量化版本加速低成本部署丨附教程

LISA微调技术解析：比LoRA更低的显存更快的速度

森马基于MaxCompute+Hologres+DataWorks构建数据中台

阿里云百炼应用实践系列-基于LlamaIndex的文档问答助手

分析性能提升40%，阿里云Hologres流量场景最佳实践

官方博客-第30页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI Infra之模型显存管理分析

FlinkSQL 的行级权限解决方案及源码

海量数据实时分析引擎 Apache Flink

通义千问开源模型在PAI灵骏的最佳实践

元象大模型开源30款量化版本 加速低成本部署丨附教程

LISA微调技术解析：比LoRA更低的显存更快的速度

森马基于MaxCompute+Hologres+DataWorks构建数据中台

阿里云百炼应用实践系列-基于LlamaIndex的文档问答助手

分析性能提升40%，阿里云Hologres流量场景最佳实践

元象大模型开源30款量化版本加速低成本部署丨附教程