官方博客-第26页-阿里云开发者社区

ModelScope

2024-05-15

1107

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,107

阿里云云原生

2024-05-21

57446

函数计算助力领健信息为“看牙”注入 AI 活力

口腔治疗+函数计算=效率提升🚀 领健作为业界领先的口腔机构，面向口腔诊所提供正畸算法，但早期的算法部署遇到较多问题，因此在对比了阿里云的多个云产品之后，最终选择了函数计算。通过将 GPU 计算负载放到函数计算，领健技术团队达到了很好的降本效果，相比早前的按月持有 GPU 资源，函数计算的费用降低了 90% 左右，并大大提升了使用体验，实现了前所未有的敏捷性和效率。

阿里云云原生

57,446

布谷

2024-09-03

576

React 的正确使用方法：ref 篇

你真的用对了 useRef 吗？在与 TypeScript 一起使用、以及撰写组件库的情况下，你的写法能够避开以下所有场景的坑吗？

布谷

576

资源编排ROS

2024-09-10

216

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）

在虚拟游戏的世界里，数字化的乐趣谱写着无数玩家的回忆。本文将指导您使用阿里云ROS CDK轻松将2048小游戏部署到云端。ROS CDK是一种强大的工具，允许您使用熟悉的编程语言定义和部署云资源，简化开发流程。此外，ECS（弹性计算服务）为您提供灵活且可扩展的计算资源，确保应用稳定运行。通过简单的环境配置和依赖安装，您可以快速创建和管理云资源，实现从本地到云端的无缝迁移。跟随本文指引，您将学会如何使用ROS CDK和ECS部署2048小游戏，并享受云端游戏的乐趣。

资源编排ROS

216

澄潭计缘望宸

2025-03-14

957

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

957

笃敏

2025-03-28

233

架构革新：揭示卓越性能与高可扩展的共赢秘诀

为了构建现代化的可观测数据采集器LoongCollector，iLogtail启动架构通用化升级，旨在提供高可靠、高可扩展和高性能的实时数据采集和计算服务。然而，通用化的过程总会伴随性能劣化，本文重点介绍LoongCollector的性能优化之路，并对通用化和高性能之间的平衡给出见解。

笃敏

233

望雲十雨言澈

2025-04-10

524

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

524

阿里云云原生

2025-08-06

379

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南

JSON 日志因灵活易扩展而广泛应用，但其海量数据也带来分析挑战。本文系统介绍阿里云日志服务（SLS）中处理 JSON 日志的最佳实践，涵盖数据预处理、索引配置、JSON 函数使用及 SQL 智能生成，助你高效挖掘日志价值。

阿里云云原生

379

资源编排ROS

2019-12-24

2171

资源编排ROS之自定制资源（多云部署Terraform篇）

资源编排服务（Resource Orchestration Service，简称ROS）是阿里云提供的一项简化云计算资源管理的服务。您可以遵循ROS定义的模板规范编写资源栈模板，在模板中定义所需的云计算资源（例如ECS实例、RDS数据库实例）、资源间的依赖关系等。

资源编排ROS

2,171

官方博客-第26页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

函数计算助力领健信息为“看牙”注入 AI 活力

React 的正确使用方法：ref 篇

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

架构革新：揭示卓越性能与高可扩展的共赢秘诀

AI Infra之模型显存管理分析

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南

资源编排ROS之自定制资源（多云部署Terraform篇）

官方博客-第26页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

函数计算助力领健信息为“看牙”注入 AI 活力

React 的正确使用方法：ref 篇

ROS CDK魔法书：建立你的游戏王国（TypeScript篇）

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

架构革新：揭示卓越性能与高可扩展的共赢秘诀

AI Infra之模型显存管理分析

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南

资源编排ROS之自定制资源（多云部署Terraform篇）