官方博客-第26页-阿里云开发者社区

  • 2024-11-29
    512

    写了BUG还想跑——闲鱼异常日志问题自动追踪-定位-分发机制

    为了高效地发现、定位和解决预发问题,闲鱼团队研发了一套异常日志问题自动追踪-定位-分发机制。这套机制通过自动化手段,实现了异常日志的定时扫描、精准定位和自动分发,显著降低了开发和测试的成本,提高了问题解决的效率。

    512
  • 2025-01-26
    432

    面对全球化的泼天流量,出海企业观测多地域网络质量

    网络监控与分析在保证网络可靠性、优化用户体验和提升运营效率方面发挥着不可或缺的作用,对于出海企业应对复杂的网络环境和满足用户需求具有重要意义,为出海企业顺利承接泼天流量保驾护航。

  • 2025-02-21
    614

    K8S异常诊断之俺的内存呢

    本文讲述作者如何解决客户集群中出现的OOM(Out of Memory)和Pod驱逐问题。文章不仅详细记录了问题的发生背景、现象特征,还深入探讨了排查过程中的关键步骤和技术细节。

    614
  • 升级JSONB列式存储,Hologres助力淘宝搜索2022双11降本增效

    升级JSONB列式存储,Hologres助力淘宝搜索2022双11降本增效。

  • 2023-04-23
    25790

    慢SQL是如何拖垮数据库的

    本文结合一个实际故障案例出发,分析慢SQL是如何打垮数据库并引发故障的。

    25,790
  • 2023-09-27
    1436

    深入MaxCompute,人力家借助Information Schema合理治理费用

    本文将为大家带来MaxCompute与人力家客户案例深度解读。

  • 2023-12-01
    3032

    分布式锁实现原理与最佳实践

    在单体的应用开发场景中涉及并发同步时,大家往往采用Synchronized(同步)或同一个JVM内Lock机制来解决多线程间的同步问题。而在分布式集群工作的开发场景中,就需要一种更加高级的锁机制来处理跨机器的进程之间的数据同步问题,这种跨机器的锁就是分布式锁。接下来本文将为大家分享分布式锁的最佳实践。

    3,032
  • 2024-05-15
    136145

    云原生场景下,AIGC 模型服务的工程挑战和应对

    本文介绍了在云原生场景下,AIGC 模型服务的工程挑战和Fluid 在云原生 AIGC 模型推理场景的优化。

  • 2024-05-15
    105555

    SLS 大模型可观测&安全推理审计标准解决方案

    本文介绍大模型可观测&安全推理审计解决方案和Demo演示,SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能,自定义仪表盘;SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据,建设完整统一的大模型可观测方案,为用户的大模型安全推理审计提供全面合规支持。

    105,555
  • 1
    ...
    25
    26
    27
    ...
    61
    到第