官方博客-第12页-阿里云开发者社区

乘凨

2024-11-29

511

写了BUG还想跑——闲鱼异常日志问题自动追踪-定位-分发机制

为了高效地发现、定位和解决预发问题，闲鱼团队研发了一套异常日志问题自动追踪-定位-分发机制。这套机制通过自动化手段，实现了异常日志的定时扫描、精准定位和自动分发，显著降低了开发和测试的成本，提高了问题解决的效率。

乘凨

511

勉成

2024-12-12

608

如何找出Java进程占用CPU高的元凶

本文记录了一次Java进程CPU占用率过高的问题和排查思路。

勉成

608

正己

2025-01-06

350

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

350

牧原

2025-02-21

614

K8S异常诊断之俺的内存呢

本文讲述作者如何解决客户集群中出现的OOM（Out of Memory）和Pod驱逐问题。文章不仅详细记录了问题的发生背景、现象特征，还深入探讨了排查过程中的关键步骤和技术细节。

牧原

614

尹丰彬

2025-02-21

831

基于虚拟服务配置的渐进式迁移实践：Istio集群至ASM集群的平滑切换

本文介绍了从Istio+k8s环境迁移到阿里云ASM+ACK环境的渐进式方法，通过配置虚拟服务和入口服务实现新老集群间的服务调用与流量转发，确保业务连续性与平滑迁移

尹丰彬

831

执少

2025-04-02

525

SLS 重磅升级：超大规模数据实现完全精确分析

SLS 全新推出的「SQL 完全精确」模式，通过“限”与“换”的策略切换，在快速分析与精确计算之间实现平衡，满足用户对于超大数据规模分析结果精确的刚性需求。标志着其在超大规模日志数据分析领域再次迈出了重要的一步。

执少

525

阿里云实时计算Flink

2023-04-13

1264

海量数据实时分析引擎 Apache Flink

当系统出现大量或者重大的错误却不被人感知，将会对业务产生影响，从而导致资产损失。当竞争对手实施了新战术，却无法及时感知，跟不上竞争对手的节奏，总是追着对方尾巴走。当要做决策的时候，海量的业务数据增长却无法实时看到聚合结果，决策总是凭借过往经验或者过时的数据分析之上。

阿里云实时计算Flink

1,264

勿烦

2023-12-01

890

MaxCompute 重装上阵，Global Zorder

MaxCompute支持Global Zorder，使得整个表或者分区的数据在全局上能按照指定字段进行ZORDER排序，以便数据能有更好的聚集性。

勿烦

890

孟威

2024-05-15

105552

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

105,552

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

写了BUG还想跑——闲鱼异常日志问题自动追踪-定位-分发机制

如何找出Java进程占用CPU高的元凶

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

K8S异常诊断之俺的内存呢

基于虚拟服务配置的渐进式迁移实践：Istio集群至ASM集群的平滑切换

SLS 重磅升级：超大规模数据实现完全精确分析

海量数据实时分析引擎 Apache Flink

MaxCompute 重装上阵，Global Zorder

SLS 大模型可观测&安全推理审计标准解决方案

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

写了BUG还想跑——闲鱼异常日志问题自动追踪-定位-分发机制

如何找出Java进程占用CPU高的元凶

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

K8S异常诊断之俺的内存呢

基于虚拟服务配置的渐进式迁移实践：Istio集群至ASM集群的平滑切换

SLS 重磅升级：超大规模数据实现完全精确分析

海量数据实时分析引擎 Apache Flink

MaxCompute 重装上阵，Global Zorder

SLS 大模型可观测&安全推理审计标准解决方案