官方博客-第13页-阿里云开发者社区

新念

2025-02-14

1425

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,425

阿里云开发者

2025-03-21

800

通义灵码2.0引入了DeepSeek V3与R1模型，新增Qwen2.5-Max和QWQ模型，支持个性化服务切换。阿里云发布开源推理模型QwQ-32B，在数学、代码及通用能力上表现卓越，性能媲美DeepSeek-R1，且部署成本低。AI程序员功能涵盖表结构设计、前后端代码生成、单元测试与错误排查，大幅提升开发效率。跨语言编程示例中，成功集成DeepSeek-R1生成公告内容。相比1.0版本，2.0支持多款模型，丰富上下文类型，具备多文件修改能力。总结显示，AI程序员生成代码准确度高，但需参考现有工程风格以确保一致性，错误排查功能强大，适合明确问题描述场景。相关链接提供下载与原文参考。

阿里云开发者

800

阿里云云原生

2025-05-23

554

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

554

张佐玮

2023-12-01

1537

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

1,537

行疾

2024-05-15

3229

阿里云容器服务 ACK AI 助手正式上线

期待已久！阿里云容器服务 ACK AI 助手正式上线

行疾

3,229

ModelScope

2024-05-15

734

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

734

张昕东

2024-07-25

14040

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,040

赵世振

2025-01-09

2059

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

本文章旨在帮助读者了解并掌握大模型多模态技术的实际应用，特别是如何构建基于多模态的实用场景。文档通过几个具体的多模态应用场景，如拍立淘、探一下和诗歌相机，展示了这些技术在日常生活中的应用潜力。

赵世振

2,059

ModelScope

2024-05-15

940

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

940

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

在IDEA中借助满血版 DeepSeek 提高编码效率

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

Koordinator 助力云原生应用性能提升，小红书混部技术实践

阿里云容器服务 ACK AI 助手正式上线

联合XTuner，魔搭社区全面支持数据集的长文本训练

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

在IDEA中借助满血版 DeepSeek 提高编码效率

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

Koordinator 助力云原生应用性能提升，小红书混部技术实践

阿里云容器服务 ACK AI 助手正式上线

联合XTuner，魔搭社区全面支持数据集的长文本训练

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent