官方博客-第21页-阿里云开发者社区

ModelScope

2024-05-15

1131

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,131

CloudImagine

2024-07-05

396

泛娱乐出海Plus时代，音视频能力基座与时俱进

泛娱乐的音视频技术随着出海在演进，交互和内容的技术是内核，也在融合。

CloudImagine

396

自扬

2024-08-16

8750

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

本文从“空间”这一维度，聊一聊PolarDB-X在跨空间部署能力上的不断发展和延伸，以及在不同空间范围下的高可用和容灾能力，并着重介绍一下最新的产品能力——GDN(Global Database Network)。

自扬

8,750

裘展

2024-11-07

1669

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,669

牧思

2024-12-02

540

一行代码都不改，Golang 应用链路指标日志全知道

本文将通过阿里云开源的 Golang Agent，帮助用户实现“一行代码都不改”就能获取到应用产生的各种观测数据，同时提升运维团队和研发团队的幸福感。

牧思

540

崔力强

2024-12-10

607

更快、更灵活、场景更丰富，云效镜像构建能力升级啦

本文介绍了云效在镜像构建方面的改进。

崔力强

607

澄潭计缘望宸

2025-03-14

984

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

984

濯光于怀

2025-04-07

375

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

AI 应用开发中，总有一些让人头疼的问题：敏感信息（比如 API-KEY）怎么安全存储？模型参数需要频繁调整怎么办？Prompt 模板改来改去，每次都得重启服务，太麻烦了！别急，今天我们就来聊聊如何用 Nacos 解决这些问题。

濯光于怀

375

以珩

2025-04-10

508

用自定义插件生成一篇图文并茂的文章

本文是《5步教你创建大模型自定义插件》的下篇，主要就已有的自定义插件中的生图能力为例，演示如何生成一个图文并茂的文章。

以珩

508

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

泛娱乐出海Plus时代，音视频能力基座与时俱进

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

白话文讲解大模型｜ Attention is all you need

一行代码都不改，Golang 应用链路指标日志全知道

更快、更灵活、场景更丰富，云效镜像构建能力升级啦

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

用自定义插件生成一篇图文并茂的文章

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

泛娱乐出海Plus时代，音视频能力基座与时俱进

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

白话文讲解大模型｜ Attention is all you need

一行代码都不改，Golang 应用链路指标日志全知道

更快、更灵活、场景更丰富，云效镜像构建能力升级啦

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

用自定义插件生成一篇图文并茂的文章