官方博客-第30页-阿里云开发者社区

ModelScope

2024-05-15

1101

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,101

阿里云云原生

2024-05-15

73720

通义灵码技术解析，打造 AI 原生开发新范式

本文第一部分先介绍 AIGC 对软件研发的根本性影响，从宏观上介绍当下的趋势；第二部分将介绍 Copilot 模式，第三部分是未来软件研发 Agent 产品的进展。

阿里云云原生

73,720

阿里云大数据Al技术

2024-07-31

7464

OSS数据源一站式RAG最佳实践

本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

阿里云大数据Al技术

7,464

阿里云云原生

2024-09-14

651

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

阿里云云原生 8 月产品月报。

阿里云云原生

651

独鳌

2024-09-30

394

阿里云 SAE Web：百毫秒高弹性的实时事件中心的架构和挑战

SAE 事件中心通过智能诊断显示通知与用户连接起来，SAE WEB 百毫秒弹性实例给事件中心带来了新的实时性、海量数据和高吞吐的挑战，本篇将带您了解 SAE 整体事件中心的架构和挑战。

独鳌

394

裘展

2024-11-07

1636

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,636

明巍临城水德

2024-11-14

501

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

501

惜鸟

2024-11-15

961

【提效】docker镜像构建优化-提速10倍

本文主要记录了自己通过查阅相关资料，一步步排查问题，最后通过优化Docerfile文件将docker镜像构建从十几分钟降低到1分钟左右，效率提高了10倍左右。

惜鸟

961

宝惜

2024-11-15

461

架构师的真内核

本文旨在帮助大家深入理解技术、架构和团队领导力的本质，从而获得持续成长的方法。欢迎在文末留言，你觉得架构师需要具备的核心能力是什么？

宝惜

461

官方博客-第30页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码技术解析，打造 AI 原生开发新范式

OSS数据源一站式RAG最佳实践

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

阿里云 SAE Web：百毫秒高弹性的实时事件中心的架构和挑战

白话文讲解大模型｜ Attention is all you need

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

【提效】docker镜像构建优化-提速10倍

架构师的真内核

官方博客-第30页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码技术解析，打造 AI 原生开发新范式

OSS数据源一站式RAG最佳实践

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

阿里云 SAE Web：百毫秒高弹性的实时事件中心的架构和挑战

白话文讲解大模型｜ Attention is all you need

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

【提效】docker镜像构建优化-提速10倍

架构师的真内核

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理