官方博客-第17页-阿里云开发者社区

正己

2025-01-06

310

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

310

阿里云云原生

2025-01-07

268

Envoy 开启 HTTP2 后偶现 404 解决方法

在大部分基于 Envoy 实现的网关里，都存在这样一个问题，当开启 http2 时，客户端访问会出现偶发的 404，并且可以从日志注意到这些 404 的请求，:authority 头里的域名和 SNI 里的域名不一致。且在使用泛域名证书，且配置了多个域名的路由的情况下，这个问题特别容易出现。

阿里云云原生

268

钰诚

2025-01-24

1891

DeepSeek-R1 来了，从 OpenAI 平滑迁移到 DeepSeek的方法

Higress 作为一款开源的 AI 网关工具，可以提供基于灰度+观测的平滑迁移方案。

钰诚

1,891

云服务器ECS

2023-12-01

80157

AI 时代的 GPU 生存工具包，每个开发人员必须知道的最低限度

AI技术迎来了“百花齐放”的春天，这既是我们的挑战也是机会。而AI+千行百业创造了无限可能，也为独立开发者提供了大量的资源、支持以及学习经验的机会。本文分享一篇摘录自Hexmos 期刊的AI 时代的 GPU 生存工具包。

云服务器ECS

80,157

阿里云消息队列

2024-05-15

892

云消息队列 Confluent 版正式上线

云消息队列 Confluent 版正式上线！

阿里云消息队列

892

隆基

2024-05-15

3767

深度剖析 RocketMQ 5.0，流存储：流场景的诉求是什么？

本文将从使用的角度出发，来更详细的展示一下流存储的场景，看看它和业务消息的场景有哪些区别。 RocketMQ 5.0 面向流存储的场景，提供了哪些特性。再结合两个数据集成的案例，来帮助大家了解流存储的用法。

隆基

3,767

阿里云云原生

2024-05-24

50179

AIOps 智能运维：比专家经验更优雅的错/慢调用分析工具

本文主要介绍ARMS 错/慢 Trace 分析功能基本原理；该功能能够覆盖哪些异常 Trace 根因；最后会介绍一些最佳实践案例。

阿里云云原生

50,179

颍川

2024-07-18

12352

从自建开源 Prometheus 迁移到阿里云托管 Prometheus 服务

阿里云可观测监控 Prometheus 版提供高性能、高可用、全托管的监控服务，对接开源生态，支持 Kubernetes、ECS 等场景，解决了自建 Prometheus+Thanos 高成本、运维复杂的问题。本文讨论在各个典型场景下的迁移方案。

颍川

12,352

澄潭望宸

2024-07-22

1028

AI 时代，网关更能打了

随着互联网从 Web 2.0 迈进到 AI 时代，用户和互联网的交互方式，AI 时代下互联网的内容生产流程都发生了显著的转变，这对基础设施（Infra）提出了新的诉求，也带来了新的机遇。Infra 包含的内容非常丰富，本文仅从网关层面分享笔者的所见所感所悟。

澄潭望宸

1,028

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Envoy 开启 HTTP2 后偶现 404 解决方法

DeepSeek-R1 来了，从 OpenAI 平滑迁移到 DeepSeek的方法

AI 时代的 GPU 生存工具包，每个开发人员必须知道的最低限度

云消息队列 Confluent 版正式上线

深度剖析 RocketMQ 5.0，流存储：流场景的诉求是什么？

AIOps 智能运维：比专家经验更优雅的错/慢调用分析工具

从自建开源 Prometheus 迁移到阿里云托管 Prometheus 服务

AI 时代，网关更能打了

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Envoy 开启 HTTP2 后偶现 404 解决方法

DeepSeek-R1 来了，从 OpenAI 平滑迁移到 DeepSeek的方法

AI 时代的 GPU 生存工具包，每个开发人员必须知道的最低限度

云消息队列 Confluent 版正式上线

深度剖析 RocketMQ 5.0，流存储：流场景的诉求是什么？

AIOps 智能运维：比专家经验更优雅的错/慢调用分析工具

从自建开源 Prometheus 迁移到阿里云托管 Prometheus 服务

AI 时代，网关更能打了