官方博客-第13页-阿里云开发者社区

丛霄章进十眠

2024-11-06

1737

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘

SAE 会继续致力于为用户提供极简易用、成本低廉、功能强大的 Serverless 应用全托管平台：“我们希望让用户做的更少而收获更多，通过 Serverless 化，深度用云就像用水电煤一样简单”。

丛霄章进十眠等

1,737

寒斜

2024-11-19

787

基于事件驱动构建 AI 原生应用

AI 应用在商业化服务的阶段会面临诸多挑战，比如更快的服务交付速度，更实时、精准的结果以及更人性化的体验等，传统架构限制于同步交互，无法满足上述需求，本篇文章给大家分享一下如何基于事件驱动架构应对上述挑战。

寒斜

787

荣阳

2025-02-28

1057

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,057

阿里云云原生

2025-04-17

1266

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

通义灵码新上的外挂 Project Rules 获得了开发者的一致好评：最小成本适配我的开发风格、相当把团队经验沉淀下来，是个很好功能……

阿里云云原生

1,266

德灵

2024-05-15

118083

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,083

ModelScope

2024-05-15

759

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

759

裘展

2024-11-07

1690

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,690

昱临

2024-11-14

1081

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

笔者结合实践经验以近期在负责的复杂表格智能问答为切入点，结合大模型的哲学三问（“是谁、从哪里来、到哪里去”），穿插阐述自己对大模型的一些理解与判断，以及面向公共云LLM的建设模式思考，并分享软件设计+模型算法结合的一些研发实践经验。

昱临

1,081

新念

2025-02-14

1452

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,452

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘

基于事件驱动构建 AI 原生应用

使用A10单卡24G复现DeepSeek R1强化学习过程

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

阿里云PAI大模型RAG对话系统最佳实践

联合XTuner，魔搭社区全面支持数据集的长文本训练

白话文讲解大模型｜ Attention is all you need

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

DeepSeek-V3 高效训练关键技术分析

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless 微服务治理神器： 阿里云 SAE 全链路灰度揭秘

基于事件驱动构建 AI 原生应用

使用A10单卡24G复现DeepSeek R1强化学习过程

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

阿里云PAI大模型RAG对话系统最佳实践

联合XTuner，魔搭社区全面支持数据集的长文本训练

白话文讲解大模型｜ Attention is all you need

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性 思考到实践经验总结

DeepSeek-V3 高效训练关键技术分析

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结