官方博客-第13页-阿里云开发者社区

新念

2025-02-14

1425

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,425

王晨

2025-04-03

811

本文探讨了MCP（Model-Calling Protocol）的兴起及其对AI生态的影响。自2月中旬起，MCP热度显著提升，GitHub Star和搜索指数均呈现加速增长趋势。MCP通过标准化协议连接大模型与外部工具，解决了碎片化集成问题，推动AI应用货币化及生态繁荣。文章分析了MCP与Function Calling的区别，指出MCP更适用于跨平台、标准化场景，而Function Calling在特定实时任务中仍具优势。此外，MCP促进了 supply端（如云厂商、大模型、中间件服务商）和消费端（终端用户）的变革，尤其以Devin和Manus为代表，分别改变了程序员和普通用户的交互方式。

王晨

811

杨永

2024-05-15

93867

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

93,867

雨鸦

2024-12-27

1543

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,543

望雲十雨言澈

2025-04-10

548

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

548

杳天

2022-12-13

2980

技术原理，Hologres Binlog技术原理揭秘

详细介绍Hologres Binlog技术原理以及最佳实践。

杳天

2,980

子白

2024-05-15

102438

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,438

阿里云实时数仓Hologres

2024-06-18

2312

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

2,312

明巍临城水德

2024-11-14

526

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

526

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

大模型上下文协议 MCP 带来了哪些货币化机会

使用KMS为MSE-Nacos敏感配置加密的最佳实践

极简开发，极速上线：构建端到端大模型应用

AI Infra之模型显存管理分析

技术原理，Hologres Binlog技术原理揭秘

大语言模型推理提速，TensorRT-LLM 高性能推理实践

森马基于MaxCompute+Hologres+DataWorks构建数据中台

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

大模型上下文协议 MCP 带来了哪些货币化机会

使用KMS为MSE-Nacos敏感配置加密的最佳实践

极简开发，极速上线：构建端到端大模型应用

AI Infra之模型显存管理分析

技术原理，Hologres Binlog技术原理揭秘

大语言模型推理提速，TensorRT-LLM 高性能推理实践

森马基于MaxCompute+Hologres+DataWorks构建数据中台

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理