官方博客-第31页-阿里云开发者社区

阿里云云原生

2024-12-10

272

微服务引擎 MSE 及云原生 API 网关 2024 年 11 月产品动态

微服务引擎 MSE 及云原生 API 网关 2024 年 11 月产品动态。

阿里云云原生

272

太业

2024-12-27

366

OpenAI全球宕机思考：谈谈可观测采集稳定性建设

文章探讨了为什么大规模集群中的可观测性服务会产生大量API请求、API服务器为何对DNS解析至关重要以及故障恢复过程为何缓慢的原因。

太业

366

涯海

2025-01-07

636

链路诊断最佳实践：1 分钟定位错慢根因

目前阿里云 ARMS 已经基于 LLM 大模型实现了单链路智能诊断，综合调用链、方法栈、异常堆栈、SQL、指标等多模态数据，结合链路诊断领域专家经验，有效识别单次请求的错慢根因，并给出相应的优化建议。

涯海

636

亦达

2025-02-20

799

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

799

阿里云中间件

2023-08-25

547

充换电企业开迈斯低成本提升线上应用稳定性的最佳实践

阿里云中间件

547

兆维

2023-08-31

636

为什么 Higress 是 Knative 入口网关的最佳实践

Knative Serving 是一款基于 K8s 的 Serverless 开源平台，用于构建和管理现代化、可拓展、流量驱动、无服务器的应用程序。本文重点关注 Knative 网络层能力的实现。

兆维

636

之卫

2024-05-15

631

Nacos 在云原生架构下的演进

之卫

631

杨磊

2024-05-15

262801

青团社：亿级灵活用工平台的云原生架构实践

青团社是国内领先的一站式灵活用工招聘服务企业，灵活用工行业的 Top1。青团社于 2013 年在杭州成立，业务已经覆盖全国，在行业深耕 10 年。我的分享将分为以下三部分：青团社架构演进的历程、青团社如何实现云原生、总结与展望。

杨磊

262,801

隆基

2024-05-15

109357

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

本文主要学习 RocketMQ 的一致性特性，一致性对于交易、金融都是刚需。从大规模复杂业务出发，学习 RocketMQ 的 SQL 订阅、定时消息等特性。再从高可用的角度来看，这里更多的是大型公司对于高阶可用性的要求，如同城容灾、异地多活等。

隆基

109,357

官方博客-第31页-阿里云开发者社区

类目筛选

内容类型

微服务引擎 MSE 及云原生 API 网关 2024 年 11 月产品动态

OpenAI全球宕机思考：谈谈可观测采集稳定性建设

链路诊断最佳实践：1 分钟定位错慢根因

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

充换电企业开迈斯低成本提升线上应用稳定性的最佳实践

为什么 Higress 是 Knative 入口网关的最佳实践

Nacos 在云原生架构下的演进

青团社：亿级灵活用工平台的云原生架构实践

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

官方博客-第31页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

微服务引擎 MSE 及云原生 API 网关 2024 年 11 月产品动态

OpenAI全球宕机思考：谈谈可观测采集稳定性建设

链路诊断最佳实践：1 分钟定位错慢根因

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

充换电企业开迈斯低成本提升线上应用稳定性的最佳实践

为什么 Higress 是 Knative 入口网关的最佳实践

Nacos 在云原生架构下的演进

青团社：亿级灵活用工平台的云原生架构实践

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？