官方博客-第20页-阿里云开发者社区

殳玄

2025-01-16

1029

现身说法，AI小白的大模型学习路径

写这篇文章的初衷：作为一个AI小白，把我自己学习大模型的学习路径还原出来，包括理解的逻辑、看到的比较好的学习材料，通过一篇文章给串起来，对大模型建立起一个相对体系化的认知，才能够在扑面而来的大模型时代，看出点门道。

殳玄

1,029

新念

2025-02-14

1439

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,439

荣阳

2025-02-28

1045

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,045

以珩

2025-04-10

512

用自定义插件生成一篇图文并茂的文章

本文是《5步教你创建大模型自定义插件》的下篇，主要就已有的自定义插件中的生图能力为例，演示如何生成一个图文并茂的文章。

以珩

512

周宇睿

2023-09-08

735

MaxCompute半结构化数据思考与创新

本文将介绍MaxCompute在半结构化数据方面的一些思考与创新，围绕半结构化数据简析、传统方案优劣对比、MaxCompute半结构化数据解决方案、收益分析。

周宇睿

735

孟威

2024-05-15

105544

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

105,544

灵亦

2024-05-15

87801

全新架构：日志服务 SLS 自研免登录方案发布

全新架构！日志服务 SLS 自研免登录方案发布

灵亦

87,801

阿里云大数据Al技术

2024-05-15

145486

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

本教程将带领大家免费领取阿里云PAI-EAS的免费试用资源，并且带领大家在 ComfyUI 环境下使用 SVD的模型，根据任何图片生成一个小短视频。

阿里云大数据Al技术

145,486

ModelScope

2024-05-15

518

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

518

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

现身说法，AI小白的大模型学习路径

DeepSeek-V3 高效训练关键技术分析

使用A10单卡24G复现DeepSeek R1强化学习过程

用自定义插件生成一篇图文并茂的文章

MaxCompute半结构化数据思考与创新

SLS 大模型可观测&安全推理审计标准解决方案

全新架构：日志服务 SLS 自研免登录方案发布

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

现身说法，AI小白的大模型学习路径

DeepSeek-V3 高效训练关键技术分析

使用A10单卡24G复现DeepSeek R1强化学习过程

用自定义插件生成一篇图文并茂的文章

MaxCompute半结构化数据思考与创新

SLS 大模型可观测&安全推理审计标准解决方案

全新架构：日志服务 SLS 自研免登录方案发布

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了