官方博客-第19页-阿里云开发者社区

龙蜥社区OpenAnolis

2024-11-06

750

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

750

裘展

2024-11-07

1670

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,670

如葑

2024-11-11

759

应用网关的演进历程和分类

唯一不变的是变化，在现代复杂的商业环境中，企业的业务形态与规模往往处于不断变化和扩大之中。这种动态发展对企业的信息系统提出了更高的要求，特别是在软件架构方面。为了应对不断变化的市场需求和业务扩展，软件架构必须进行相应的演进和优化。网关作为互联网流量的入口，其形态也在跟随软件架构持续演进迭代中。我们下面就聊一聊网关的演进历程以及在时下火热的 AI 浪潮下，网关又会迸发怎样新的形态。

如葑

759

以珩

2025-04-10

509

用自定义插件生成一篇图文并茂的文章

本文是《5步教你创建大模型自定义插件》的下篇，主要就已有的自定义插件中的生图能力为例，演示如何生成一个图文并茂的文章。

以珩

509

王明橙鲤黄俊

2024-05-15

64124

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,124

ModelScope

2024-05-15

1205

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,205

ModelScope

2024-05-15

740

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

740

明巍临城水德

2024-11-14

532

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

532

青熙

2024-11-15

1226

AI经营｜多Agent择优生成商品标题

商品标题中关键词的好坏是商品能否被主搜检索到的关键因素，使用大模型自动优化标题成为【AI经营】中的核心能力之一，本文讲述大模型如何帮助商家优化商品素材，提升商品竞争力。

青熙

1,226

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

白话文讲解大模型｜ Attention is all you need

应用网关的演进历程和分类

用自定义插件生成一篇图文并茂的文章

通义千问开源模型在PAI灵骏的最佳实践

元象大模型开源30款量化版本加速低成本部署丨附教程

联合XTuner，魔搭社区全面支持数据集的长文本训练

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

AI经营｜多Agent择优生成商品标题

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

白话文讲解大模型｜ Attention is all you need

应用网关的演进历程和分类

用自定义插件生成一篇图文并茂的文章

通义千问开源模型在PAI灵骏的最佳实践

元象大模型开源30款量化版本 加速低成本部署丨附教程

联合XTuner，魔搭社区全面支持数据集的长文本训练

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

AI经营｜多Agent择优生成商品标题

元象大模型开源30款量化版本加速低成本部署丨附教程

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理