官方博客-第11页-阿里云开发者社区

新念

2025-02-14

1570

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,570

阿里云云原生

2025-06-24

668

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

通义灵码现已全面支持Qwen3，新增智能体模式，具备自主决策、环境感知、工具使用等能力，可端到端完成编码任务。支持问答、文件编辑、智能体多模式自由切换，结合MCP工具与记忆功能，提升开发效率。AI IDE重构编程流程，让开发更智能高效。

阿里云云原生

668

阿里云云原生

2025-04-17

1436

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

通义灵码新上的外挂 Project Rules 获得了开发者的一致好评：最小成本适配我的开发风格、相当把团队经验沉淀下来，是个很好功能……

阿里云云原生

1,436

ModelScope

2024-05-15

906

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

Mistral AI在3月24日突然发布并开源了 Mistral 7B v0.2模型，有如下几个特点

ModelScope

906

李德

2024-12-06

1480

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,480

阿里云云原生

2025-08-01

1153

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

Qwen3 Coder 是全球领先的开源编程大模型，具备强大的代码生成能力与1M超长上下文支持，适用于构建复杂应用。本文通过实际案例展示其在电商网站开发中的应用，并详解提示词设计、技术拆解与部署方案，探讨Agentic AI落地的挑战与经验。

阿里云云原生

1,153

ModelScope

2024-05-15

110146

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,146

龙蜥社区OpenAnolis

2024-11-06

888

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

888

望宸

2025-02-28

1294

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,294

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

大模型推理主战场：通信协议的标配

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

大模型推理主战场：通信协议的标配