官方博客-第30页-阿里云开发者社区

ModelScope

2024-05-15

1101

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,101

阿里云云原生

2024-05-15

73720

通义灵码技术解析，打造 AI 原生开发新范式

本文第一部分先介绍 AIGC 对软件研发的根本性影响，从宏观上介绍当下的趋势；第二部分将介绍 Copilot 模式，第三部分是未来软件研发 Agent 产品的进展。

阿里云云原生

73,720

阿里云大数据Al技术

2024-07-31

7464

OSS数据源一站式RAG最佳实践

本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

阿里云大数据Al技术

7,464

阿里云云原生

2024-08-06

8542

【AI 冰封挑战】搭档函数计算，“冰”封你的夏日记忆

夏日炎炎，别让高温打败你的创意，立即体验 ComfyUI 自制冰冻滤镜！无需繁琐的后期技巧，三步开启一段清凉无比的视觉探险。参与实验并上传作品即可获得运动无线蓝牙耳机，限量 800 个，先到先得！

阿里云云原生

8,542

阿里云云原生

2024-09-14

651

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

阿里云云原生 8 月产品月报。

阿里云云原生

651

付宇轩

2024-09-14

731

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

阿里云函数计算与 NVIDIA TensorRT/TensorRT-LLM 展开合作，通过结合阿里云的无缝计算体验和 NVIDIA 的高性能推理库，开发者能够以更低的成本、更高的效率完成复杂的 AI 任务，加速技术落地和应用创新。

付宇轩

731

独鳌

2024-09-30

394

阿里云 SAE Web：百毫秒高弹性的实时事件中心的架构和挑战

SAE 事件中心通过智能诊断显示通知与用户连接起来，SAE WEB 百毫秒弹性实例给事件中心带来了新的实时性、海量数据和高吞吐的挑战，本篇将带您了解 SAE 整体事件中心的架构和挑战。

独鳌

394

裘展

2024-11-07

1636

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,636

明巍临城水德

2024-11-14

501

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

501

官方博客-第30页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码技术解析，打造 AI 原生开发新范式

OSS数据源一站式RAG最佳实践

【AI 冰封挑战】搭档函数计算，“冰”封你的夏日记忆

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

阿里云 SAE Web：百毫秒高弹性的实时事件中心的架构和挑战

白话文讲解大模型｜ Attention is all you need

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

官方博客-第30页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码技术解析，打造 AI 原生开发新范式

OSS数据源一站式RAG最佳实践

【AI 冰封挑战】搭档函数计算，“冰”封你的夏日记忆

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

阿里云 SAE Web：百毫秒高弹性的实时事件中心的架构和挑战

白话文讲解大模型｜ Attention is all you need

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理