官方博客-第20页-阿里云开发者社区

新念

2025-02-14

1425

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,425

阿里云开发者

2025-03-21

800

通义灵码2.0引入了DeepSeek V3与R1模型，新增Qwen2.5-Max和QWQ模型，支持个性化服务切换。阿里云发布开源推理模型QwQ-32B，在数学、代码及通用能力上表现卓越，性能媲美DeepSeek-R1，且部署成本低。AI程序员功能涵盖表结构设计、前后端代码生成、单元测试与错误排查，大幅提升开发效率。跨语言编程示例中，成功集成DeepSeek-R1生成公告内容。相比1.0版本，2.0支持多款模型，丰富上下文类型，具备多文件修改能力。总结显示，AI程序员生成代码准确度高，但需参考现有工程风格以确保一致性，错误排查功能强大，适合明确问题描述场景。相关链接提供下载与原文参考。

阿里云开发者

800

阿里云云原生

2025-05-23

554

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

554

行疾

2024-05-15

3229

阿里云容器服务 ACK AI 助手正式上线

期待已久！阿里云容器服务 ACK AI 助手正式上线

行疾

3,229

荆磊

2024-05-15

56127

更优性能与性价比，从自建 ELK 迁移到 SLS 开始

本文介绍了 SLS 基本能力，并和开源自建 ELK 做了对比，可以看到 SLS 相比开源 ELK 有较大优势。

荆磊

56,127

ModelScope

2024-05-15

734

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

734

阿里云实时数仓Hologres

2024-06-18

2312

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

2,312

张昕东

2024-07-25

14040

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,040

阿里云瑶池数据库

2024-11-06

1709

大咖说｜Data+AI：企业智能化转型的核心驱动力

阿里云DMS+X：一站式Data+AI平台

阿里云瑶池数据库

1,709

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

在IDEA中借助满血版 DeepSeek 提高编码效率

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

阿里云容器服务 ACK AI 助手正式上线

更优性能与性价比，从自建 ELK 迁移到 SLS 开始

联合XTuner，魔搭社区全面支持数据集的长文本训练

森马基于MaxCompute+Hologres+DataWorks构建数据中台

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

大咖说｜Data+AI：企业智能化转型的核心驱动力

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

在IDEA中借助满血版 DeepSeek 提高编码效率

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

阿里云容器服务 ACK AI 助手正式上线

更优性能与性价比，从自建 ELK 迁移到 SLS 开始

联合XTuner，魔搭社区全面支持数据集的长文本训练

森马基于MaxCompute+Hologres+DataWorks构建数据中台

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

大咖说｜Data+AI：企业智能化转型的核心驱动力