子丑

2024-08-26

十六年所思所感，聊聊这些年我所经历的 DevOps 系统

从 2008 年开始，我陆陆续续参与了多个 DevOps 系统的建设，如今，审视这些系统的建设初衷和它们的设计思路或遇到的问题，依然有不少借鉴意义。我会按照时间顺序，把每个 DevOps 系统的特点，诞生的背景，以及在当时所主要解决的问题做一个概要的介绍，同时，我们也会以今天的视角再次审视这些问题，来看下同样的问题，经过十几年的发展，解决方案上有哪些不同。

子丑

79

望宸彦林

2024-06-24

50708

从云原生视角看 AI 原生应用架构的实践

本文核心观点： • 基于大模型的 AI 原生应用将越来越多，容器和微服务为代表的云原生技术将加速渗透传统业务。 • API 是 AI 原生应用的一等公民，并引入了更多流量，催生企业新的生命力和想象空间。 • AI 原生应用对网关的需求超越了传统的路由和负载均衡功能，承载了更大的 AI 工程化使命。 • AI Infra 的一致性架构至关重要，API 网关、消息队列、可观测是 AI Infra 的重要组成。

望宸彦林

50,708

闵子

2023-12-01

1161

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

1,161

无哲

2024-05-15

47011

SLS 查询新范式：使用 SPL 对日志进行交互式探索

像 Unix 命令一样支持多级管道级联，像加工预览一样实时处理查询结果，更便捷的交互，更丰富的算子，更灵活的探索半结构化日志，快来试试使用 SPL 语言查询日志数据吧~

无哲

47,011

颍川

2024-07-18

11919

从自建开源 Prometheus 迁移到阿里云托管 Prometheus 服务

阿里云可观测监控 Prometheus 版提供高性能、高可用、全托管的监控服务，对接开源生态，支持 Kubernetes、ECS 等场景，解决了自建 Prometheus+Thanos 高成本、运维复杂的问题。本文讨论在各个典型场景下的迁移方案。

颍川

11,919

余韬

2024-08-13

207

跟着 iLogtail 学习高质量软件建设

复杂的运行环境、巨大的部署量和高速发展业务迭代对 Agent 的软件工程质量带来了巨大挑战。基于阿里云可观测团队多年的开发和运维经验，本文将分享如何构建和执行可靠性工程策略。

余韬

207

孟威

2024-05-15

104256

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

104,256

豁朗

2021-08-13

1751

用SLS配置日志关键字告警的N种方法

本文主要介绍一种免运维，高性能，支持灵活配置的方案，使用SLS接入日志和告警。

豁朗

1,751

隆基

2024-05-15

108474

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

本文主要学习 RocketMQ 的一致性特性，一致性对于交易、金融都是刚需。从大规模复杂业务出发，学习 RocketMQ 的 SQL 订阅、定时消息等特性。再从高可用的角度来看，这里更多的是大型公司对于高阶可用性的要求，如同城容灾、异地多活等。

隆基

108,474

类目筛选

内容类型

十六年所思所感，聊聊这些年我所经历的 DevOps 系统

从云原生视角看 AI 原生应用架构的实践

从浏览器原理出发聊聊Chrome插件

SLS 查询新范式：使用 SPL 对日志进行交互式探索

从自建开源 Prometheus 迁移到阿里云托管 Prometheus 服务

跟着 iLogtail 学习高质量软件建设

SLS 大模型可观测&安全推理审计标准解决方案

用SLS配置日志关键字告警的N种方法

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？