官方博客-第22页-阿里云开发者社区

宝惜

2024-11-15

517

架构师的真内核

本文旨在帮助大家深入理解技术、架构和团队领导力的本质，从而获得持续成长的方法。欢迎在文末留言，你觉得架构师需要具备的核心能力是什么？

宝惜

517

右予故黎

2024-11-21

1008

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

1,008

阿里云云原生

2025-01-26

1289

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,289

新念

2025-02-14

1469

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,469

望宸

2025-02-20

688

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

688

言澈

2025-02-28

1218

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,218

阿里云云原生

2025-04-07

712

极氪汽车云原生架构落地实践

随着极氪数字业务的飞速发展，背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验，并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。

阿里云云原生

712

阿里云云原生

2025-05-19

628

Higress MCP Server 安全再升级：API 认证为 AI 连接保驾护航

Higress MCP Server 新增了 API 认证功能，为 AI 连接提供安全保障。主要更新包括：1) 客户端到 MCP Server 的认证，支持 Key Auth、JWT Auth 和 OAuth2；2) MCP Server 到后端 API 的认证，增强第二阶段的安全性。新增功能如可重用认证方案、工具特定后端认证、透明凭证透传及灵活凭证管理，确保安全集成更多后端服务。通过 openapi-to-mcp 工具简化配置，减少手动工作量。企业版提供更高可用性保障，详情参见文档链接。

阿里云云原生

628

阿里云云原生

2025-08-26

538

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

阿里云云速搭 CADT（Cloud Architect Design Tools）推出智能化升级——云小搭，一款基于大模型的 AI 云架构助手，致力于让每一位用户都能“动动嘴”就完成专业级云架构设计。

阿里云云原生

538

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

架构师的真内核

“无”中生有：基于知识增强的RAG优化实践

最近谈论 SSE 和 WebSocket 的人越来越多的原因

DeepSeek-V3 高效训练关键技术分析

大模型推理服务全景图

进行GPU算力管理

极氪汽车云原生架构落地实践

Higress MCP Server 安全再升级：API 认证为 AI 连接保驾护航

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

架构师的真内核

“无”中生有：基于知识增强的RAG优化实践

最近谈论 SSE 和 WebSocket 的人越来越多的原因

DeepSeek-V3 高效训练关键技术分析

大模型推理服务全景图

进行GPU算力管理

极氪汽车云原生架构落地实践

Higress MCP Server 安全再升级：API 认证为 AI 连接保驾护航

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图