官方博客-第26页-阿里云开发者社区

阿里云云原生

2024-11-01

953

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

953

望宸

2025-02-07

734

浏览量超 10w 的热图，描述 RAG 的主流架构

大模型性能的持续提升，进一步挖掘了 RAG 的潜力，RAG 将检索系统与生成模型相结合，带来诸多优势，如实时更新知识、降低成本等。点击本文，为您梳理 RAG 的基本信息，并介绍提升大模型生成结果的方法，快一起看看吧~

望宸

734

新念

2025-02-14

1391

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,391

子葵于怀

2025-04-10

860

0代码将存量 API 适配 MCP 协议

本文主要讲述通过 Nacos+Higress 的方案实现0代码改造将 Agent 连接到存量应用，能够显著降低存量应用的改造成本。

子葵于怀

860

濯光翼严

2025-04-15

524

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

无论是使用 Nacos-Controller 实现配置的双向同步，还是直接在应用中接入 Nacos SDK 以获得更高级的配置管理特性，都能显著提升配置管理的灵活性、安全性和可维护性。使用 Nacos，您能够更好地管理和优化您的应用配置，从而提高系统的稳定性和可靠性。

濯光翼严

524

阿里云云原生

2025-05-23

528

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

528

阿里云云原生

2025-06-30

404

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

404

阿里云云原生

473

Serverless JManus: 企业生产级通用智能体运行时

JManus 是面向 Java 的企业级通用智能体框架，支持多 Agent 框架、MCP 协议和 PLAN-ACT 模式，具备高可用、弹性伸缩的特性。结合阿里云 Serverless 运行时 SAE 和 FC，实现稳定安全的智能体应用部署与运行。

阿里云云原生

473

阿里云云原生

2025-08-06

376

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南

JSON 日志因灵活易扩展而广泛应用，但其海量数据也带来分析挑战。本文系统介绍阿里云日志服务（SLS）中处理 JSON 日志的最佳实践，涵盖数据预处理、索引配置、JSON 函数使用及 SQL 智能生成，助你高效挖掘日志价值。

阿里云云原生

376

官方博客-第26页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

浏览量超 10w 的热图，描述 RAG 的主流架构

DeepSeek-V3 高效训练关键技术分析

0代码将存量 API 适配 MCP 协议

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Serverless JManus: 企业生产级通用智能体运行时

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南

官方博客-第26页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

浏览量超 10w 的热图，描述 RAG 的主流架构

DeepSeek-V3 高效训练关键技术分析

0代码将存量 API 适配 MCP 协议

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Serverless JManus: 企业生产级通用智能体运行时

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南