官方博客-第19页-阿里云开发者社区

ModelScope

2024-05-15

1131

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,131

自扬

2024-08-16

8750

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

本文从“空间”这一维度，聊一聊PolarDB-X在跨空间部署能力上的不断发展和延伸，以及在不同空间范围下的高可用和容灾能力，并着重介绍一下最新的产品能力——GDN(Global Database Network)。

自扬

8,750

裘展

2024-11-07

1669

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,669

崔力强

2024-12-10

607

更快、更灵活、场景更丰富，云效镜像构建能力升级啦

本文介绍了云效在镜像构建方面的改进。

崔力强

607

澄潭计缘望宸

2025-03-14

984

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

984

以珩

2025-04-10

508

用自定义插件生成一篇图文并茂的文章

本文是《5步教你创建大模型自定义插件》的下篇，主要就已有的自定义插件中的生图能力为例，演示如何生成一个图文并茂的文章。

以珩

508

子葵于怀

2025-04-10

899

0代码将存量 API 适配 MCP 协议

本文主要讲述通过 Nacos+Higress 的方案实现0代码改造将 Agent 连接到存量应用，能够显著降低存量应用的改造成本。

子葵于怀

899

阿里云基础设施.

2025-05-01

382

ACK AI Profiling：从黑箱到透明的问题剖析

本文从一个通用的客户问题出发，描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查，最后到问题定位与解决、业务执行过程的分析，从而展现一个从黑箱到透明的精细化的剖析过程。

阿里云基础设施.

382

闵子

2023-12-01

2876

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

2,876

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

白话文讲解大模型｜ Attention is all you need

更快、更灵活、场景更丰富，云效镜像构建能力升级啦

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

用自定义插件生成一篇图文并茂的文章

0代码将存量 API 适配 MCP 协议

ACK AI Profiling：从黑箱到透明的问题剖析

从浏览器原理出发聊聊Chrome插件

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

白话文讲解大模型｜ Attention is all you need

更快、更灵活、场景更丰富，云效镜像构建能力升级啦

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

用自定义插件生成一篇图文并茂的文章

0代码将存量 API 适配 MCP 协议

ACK AI Profiling：从黑箱到透明的问题剖析

从浏览器原理出发聊聊Chrome插件