官方博客-第17页-阿里云开发者社区

  • 2024-12-05
    839

    我的程序突然罢工了|深入探究HSF调用异常,从死锁到活锁的全面分析与解决

    本文详细记录了作者在处理HSF调用异常问题的过程中,从初步怀疑死锁到最终发现并解决活锁问题的全过程。

    839
  • 2024-12-26
    800

    网络安全视角:从地域到账号的阿里云日志审计实践

    日志审计的必要性在于其能够帮助企业和组织落实法律要求,打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用,一方面是选择国家网络安全专用认证的日志分析产品,另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外,还可通过报表分析和告警配置,主动发现潜在的安全威胁,增强云上资产安全。

    800
  • 2025-04-07
    690

    极氪汽车云原生架构落地实践

    随着极氪数字业务的飞速发展,背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验,并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。

  • 2025-04-28
    715

    StrmVol 存储卷:解锁 K8s 对象存储海量小文件访问性能新高度

    本文介绍了阿里云容器服务(ACK)支持的StrmVol存储卷方案,旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统(如EROFS)结合,StrmVol显著降低了小文件访问延迟,适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销,以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务,模拟分布式图像数据集加载,测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况,详细使用方法可参考官方文档。

  • 2025-04-29
    686

    剑指大规模 AI 可观测,阿里云 Prometheus 2.0 应运而生

    本文介绍了阿里云Prometheus 2.0方案,针对大规模AI系统的可观测性挑战进行全面升级。内容涵盖数据采集、存储、计算、查询及生态整合等维度。 Prometheus 2.0引入自研LoongCollector实现多模态数据采集,采用全新时序存储引擎提升性能,并支持RecordingRule与ScheduleSQL预聚合计算。查询阶段提供跨区域、跨账号的统一查询能力,结合PromQL与SPL语言增强分析功能。此外,该方案已成功应用于阿里云内部AI系统,如百炼、通义千问等大模型全链路监控。未来,阿里云将发布云监控2.0产品,进一步完善智能观测技术栈。

  • 升级JSONB列式存储,Hologres助力淘宝搜索2022双11降本增效

    升级JSONB列式存储,Hologres助力淘宝搜索2022双11降本增效。

  • 2023-04-23
    25781

    慢SQL是如何拖垮数据库的

    本文结合一个实际故障案例出发,分析慢SQL是如何打垮数据库并引发故障的。

    25,781
  • 2023-07-18
    131019

    手把手教你使用OSS-HDFS服务平替自建HDFS

    本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

    131,019
  • 2023-09-22
    1735

    沉浸式学习PostgreSQL|PolarDB 17: 向量数据库, 通义大模型AI的外脑

    本文所涉及的实验体验的就是怎么建设AI的外脑?向量数据库的核心价值:AI外脑

    1,735
  • 1
    ...
    16
    17
    18
    ...
    48
    到第