官方博客-第19页-阿里云开发者社区

裘展

2024-11-07

1672

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,672

承慕

2025-01-02

1230

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强

在过去半年，ALB Ingress Controller推出了多项高级特性，包括支持AScript自定义脚本、慢启动、连接优雅中断等功能，增强了产品的灵活性和用户体验。此外，还推出了ingress2Albconfig工具，方便用户从Nginx Ingress迁移到ALB Ingress，以及通过Webhook服务实现更智能的配置校验，减少错误配置带来的影响。在容灾部署方面，支持了多集群网关，提高了系统的高可用性和容灾能力。这些改进旨在为用户提供更强大、更安全的云原生网关解决方案。

承慕

1,230

榆松

2025-01-14

1197

网络分析与监控：阿里云拨测方案解密

阿里云网络拨测业务提供了全球、多种协议、多种网络态势的用户网络性能和用户体验监控场景的全面可观测方案。该文章从拨测场景下，介绍了用户如何快速的构建一套全球用户视角的服务可用性大盘，为客户的业务保驾护航。

榆松

1,197

阿里云开发者

2025-03-21

807

在IDEA中借助满血版 DeepSeek 提高编码效率

通义灵码2.0引入了DeepSeek V3与R1模型，新增Qwen2.5-Max和QWQ模型，支持个性化服务切换。阿里云发布开源推理模型QwQ-32B，在数学、代码及通用能力上表现卓越，性能媲美DeepSeek-R1，且部署成本低。AI程序员功能涵盖表结构设计、前后端代码生成、单元测试与错误排查，大幅提升开发效率。跨语言编程示例中，成功集成DeepSeek-R1生成公告内容。相比1.0版本，2.0支持多款模型，丰富上下文类型，具备多文件修改能力。总结显示，AI程序员生成代码准确度高，但需参考现有工程风格以确保一致性，错误排查功能强大，适合明确问题描述场景。相关链接提供下载与原文参考。

阿里云开发者

807

阿里云云原生

2025-04-07

686

极氪汽车云原生架构落地实践

随着极氪数字业务的飞速发展，背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验，并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。

阿里云云原生

686

王明橙鲤黄俊

2024-05-15

64126

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,126

ModelScope

2024-05-15

1207

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,207

ModelScope

2024-05-15

1133

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,133

ModelScope

2024-05-15

742

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

742

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

白话文讲解大模型｜ Attention is all you need

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强

网络分析与监控：阿里云拨测方案解密

在IDEA中借助满血版 DeepSeek 提高编码效率

极氪汽车云原生架构落地实践

通义千问开源模型在PAI灵骏的最佳实践

元象大模型开源30款量化版本加速低成本部署丨附教程

LISA微调技术解析：比LoRA更低的显存更快的速度

联合XTuner，魔搭社区全面支持数据集的长文本训练

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

白话文讲解大模型｜ Attention is all you need

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强

网络分析与监控：阿里云拨测方案解密

在IDEA中借助满血版 DeepSeek 提高编码效率

极氪汽车云原生架构落地实践

通义千问开源模型在PAI灵骏的最佳实践

元象大模型开源30款量化版本 加速低成本部署丨附教程

LISA微调技术解析：比LoRA更低的显存更快的速度

联合XTuner，魔搭社区全面支持数据集的长文本训练

元象大模型开源30款量化版本加速低成本部署丨附教程