官方博客-第17页-阿里云开发者社区

新念

2025-02-14

1410

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,410

望宸

2025-02-28

1057

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,057

探索云世界

2025-08-12

442

「迁移急救包」全云平台无缝迁移云效实操手册

阿里云云效是国内领先的一站式DevOps平台，提供代码全生命周期管理、智能化交付流水线及精细化研发管控，支持多种开发场景。本文详细介绍了从其他平台（如Coding）向云效迁移的完整方案，包括代码仓库、流水线、制品仓库及项目数据的迁移步骤，帮助用户实现高效、安全的平滑迁移，提升研发效率与协作能力。

探索云世界

442

子白

2024-05-15

102427

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,427

ModelScope

2024-05-15

2568

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,568

阿里云云原生

2024-05-15

55702

Higress 全新 Wasm 运行时，性能大幅提升

本文介绍 Higress 将 Wasm 插件的运行时从 V8 切换到 WebAssembly Micro Runtime (WAMR) 的最新进展。

阿里云云原生

55,702

阿里云中间件

2024-07-23

15605

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

大语言模型的革命性突破使智能编程成为了可能，通义灵码正是基于通义大模型打造的 AI 编程助手，通过 IDE 插件的形式提供代码补全、单元测试生成等功能，能达到毫秒级的响应速度。目前，通义灵码已在阿里云内部及多家企业中应用，阿里云也在探索多智能体产品，即 AI 程序员，助力数字世界的蓬勃发展，颠覆 IT 生产力。

阿里云中间件

15,605

阿里云云原生

2024-07-30

3571

5 大场景上手通义灵码企业知识库问答

通义灵码在企业版里还引入了一个超酷的新技能：RAG（Retrieval-Augmented Generation）检索增强生成的能力，本文就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

3,571

阿里云网络

2025-01-16

684

NSDI'24 | 阿里云飞天洛神云网络论文解读——《LuoShen》揭秘新型融合网关洛神云网关

NSDI‘24于4月16-18日在美国圣塔克拉拉市举办，阿里云飞天洛神云网络首次中稿NSDI，两篇论文入选。其中《LuoShen: A Hyper-Converged Programmable Gateway for Multi-Tenant Multi-Service Edge Clouds》提出超融合网关LuoShen，基于Tofino、FPGA和CPU的新型硬件形态，将公有云VPC设施部署到边缘机柜中，实现小型化、低成本和高性能。该方案使成本降低75%，空间占用减少87%，并提供1.2Tbps吞吐量，展示了强大的技术竞争力。

阿里云网络

684

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

大模型推理主战场：通信协议的标配

「迁移急救包」全云平台无缝迁移云效实操手册

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

Higress 全新 Wasm 运行时，性能大幅提升

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

5 大场景上手通义灵码企业知识库问答

NSDI'24 | 阿里云飞天洛神云网络论文解读——《LuoShen》揭秘新型融合网关洛神云网关

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

大模型推理主战场：通信协议的标配

「迁移急救包」全云平台无缝迁移云效实操手册

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

Higress 全新 Wasm 运行时，性能大幅提升

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

5 大场景上手通义灵码企业知识库问答

NSDI'24 | 阿里云飞天洛神云网络论文解读——《LuoShen》揭秘新型融合网关 洛神云网关

NSDI'24 | 阿里云飞天洛神云网络论文解读——《LuoShen》揭秘新型融合网关洛神云网关