官方博客-第21页-阿里云开发者社区

  • 2024-12-27
    337

    OpenAI全球宕机思考:谈谈可观测采集稳定性建设

    文章探讨了为什么大规模集群中的可观测性服务会产生大量API请求、API服务器为何对DNS解析至关重要以及故障恢复过程为何缓慢的原因。

    337
  • 2025-04-28
    715

    StrmVol 存储卷:解锁 K8s 对象存储海量小文件访问性能新高度

    本文介绍了阿里云容器服务(ACK)支持的StrmVol存储卷方案,旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统(如EROFS)结合,StrmVol显著降低了小文件访问延迟,适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销,以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务,模拟分布式图像数据集加载,测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况,详细使用方法可参考官方文档。

  • 2023-07-18
    131019

    手把手教你使用OSS-HDFS服务平替自建HDFS

    本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

    131,019
  • 2023-09-27
    1428

    深入MaxCompute,人力家借助Information Schema合理治理费用

    本文将为大家带来MaxCompute与人力家客户案例深度解读。

  • 2023-12-01
    62661

    SLS支持高精度时间戳和全局排序

    日志内容本身是一种重要信息,日志之间的相对顺序也是因果关系的一种反映,某些场景下如果日志内容完全相同,但是日志间的顺序错乱了反映出来的结果可能和真实世界里面的事件完全相反。

    62,661
  • 2024-05-15
    61730

    面向全栈可观测的分布式链路追踪

    全栈可观测App提供了一套完整的分析工具,从数据统计分析能力到数据关联,再到具备智能化和自动化特性的相关工具,以解决人们在可观测性方面所遇到的问题。未来,我们将持续提供更加丰富和强大的分析工具来满足用户的需求。

    61,730
  • 2024-05-15
    126036

    弱结构化日志 Flink SQL 怎么写?SLS SPL 来帮忙

    弱结构化日志 Flink SQL 怎么写?SLS SPL 来帮忙

    126,036
  • 2024-05-15
    384

    日志审计:多账号下VPC流日志采集与监控方案

    本文主要介绍如何基于日志审计进行跨账号的VPC流日志采集与监控。

    384
  • 2024-06-24
    56453

    解锁分布式云多集群统一监控的云上最佳实践

    为应对分布式云多集群监控的挑战,阿里云可观测监控 Prometheus 版结合 ACK One,凭借高效纳管与全局监控方案有效破解了用户在该场景的监控运维痛点,为日益增长的业务需求提供了一站式、高效、统一的监控解决方案,实现成本与运维效率的双重优化。助力企业的数字化转型与业务快速增长,在复杂多变的云原生时代中航行,提供了一个强有力的罗盘与风帆。

    56,453
  • 1
    ...
    20
    21
    22
    ...
    66
    到第