官方博客-第12页-阿里云开发者社区

望宸

2025-02-07

732

浏览量超 10w 的热图，描述 RAG 的主流架构

大模型性能的持续提升，进一步挖掘了 RAG 的潜力，RAG 将检索系统与生成模型相结合，带来诸多优势，如实时更新知识、降低成本等。点击本文，为您梳理 RAG 的基本信息，并介绍提升大模型生成结果的方法，快一起看看吧~

望宸

732

元乙

2025-02-14

450

2025 年可观测 10 大趋势预测

下述报告主要整理自各大网站发布的对 2025 年可观测趋势的预测，作者合并同类项汇总 10 个共性的趋势，欢迎大家一起讨论。

元乙

450

言澈

2025-02-28

1152

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,152

寒斜

2021-12-29

1194

关于函数计算异步调用异常的处理方法

介绍一下如何处理异步调用函数异常的问题

寒斜

1,194

阿里云云原生

2024-05-15

136123

云原生场景下，AIGC 模型服务的工程挑战和应对

本文介绍了在云原生场景下，AIGC 模型服务的工程挑战和Fluid 在云原生 AIGC 模型推理场景的优化。

阿里云云原生

136,123

吴昆

2024-05-15

49918

秒级弹性，探索弹性调度与虚拟节点如何迅速响应瞬时算力需求

秒级弹性！探索弹性调度与虚拟节点如何迅速响应瞬时算力需求？

吴昆

49,918

杨永

2024-05-15

1441

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

针对Springboot里面使用开源工具使用加解密，替换成阿里云KMS产品进行加解密；

杨永

1,441

王骜

2024-05-15

165214

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

165,214

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

2024-12-25

611

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

聚焦近日OpenAI的大规模K8s集群故障，介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案：包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

611

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

浏览量超 10w 的热图，描述 RAG 的主流架构

2025 年可观测 10 大趋势预测

进行GPU算力管理

关于函数计算异步调用异常的处理方法

云原生场景下，AIGC 模型服务的工程挑战和应对

秒级弹性，探索弹性调度与虚拟节点如何迅速响应瞬时算力需求

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

浏览量超 10w 的热图，描述 RAG 的主流架构

2025 年可观测 10 大趋势预测

进行GPU算力管理

关于函数计算异步调用异常的处理方法

云原生场景下，AIGC 模型服务的工程挑战和应对

秒级弹性，探索弹性调度与虚拟节点如何迅速响应瞬时算力需求

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性