官方博客-第53页-阿里云开发者社区

  • Post-Training on PAI (3):PAI-ChatLearn,PAI 自研高性能强化学习框架

    人工智能平台 PAI 推出了高性能一体化强化学习框架 PAI-Chatlearn,从框架层面解决强化学习在计算性能和易用性方面的挑战。

  • 2024-05-15
    424

    618大促来袭,浅谈如何做好大促备战

    本文介绍了阿里云上关于大促备战的最佳实践。

    424
  • 2024-05-15
    500

    基于 OPLG 从 0 到 1 构建统一可观测平台实践

    “可观测”是近几年比较火的一个议题,而 OPLG 就是包含了 OpenTelemetry、Prometheus、Loki 和 Grafana 在内的开源可观测技术合集,它们之间将碰撞出什么样的火花?请阅读本文介绍的基于 OPLG 从 0 到 1 构建统一可观测平台实践。

    500
  • 2024-05-15
    304

    基于EventBridge HTTP Source构建SaaS应用集成的最佳实践

    本文将介绍基于EventBridge HTTP Source构建SaaS应用集成的最佳实践。

    304
  • 2024-05-15
    629

    OpenSergo 流量路由:从场景到标准化的探索

    本文从常见的微服务治理场景出发,从流量路由这个场景入手。先是根据流量路由的实践设计流量路由的 Spec,同时在 Spring Cloud Alibaba 中实践遵循 OpenSergo 标准的流量路由能力。

    629
  • 2024-05-15
    275

    通过定时SQL提取阿里云API网关访问日志指标

    背景阿里云API网关服务提供API托管服务,提供了强大的适配和集成能力,可以将各种不同的业务系统API实现统一管理。API网关同时支持将API访问日志一键存储到日志服务,通过日志服务强大的查询分析能力,用户可以针对访问日志自定义计算多种指标,监测服务运行情况。继而通过定时SQL将结果指标直接存储到时...

    275
  • 2024-05-15
    672

    【Terraform实现云服务基础设施既代码(IaC)案例实战-2】:通过Terraform实施基础IaC

    前言树苗科技公司业务上云2年有余,随着技术的不断发展。运维团队支持业务变更配置、开资源、删资源等过程加班到深夜一两点已是家常便饭。为了进一步提升工作效率,运维总监张三决定对当前业务交付路径进行统一梳理,借助IaC的理念和Terraform自动化工具逐步实施运维生产自动化,改善组内成员频繁加班的现状。...

    672
  • 2024-05-15
    351

    OpenSergo/MSE & CloudWeGo 共同保障微服务运行时流量稳定性

    微服务运行时稳定性的问题微服务的稳定性一直是开发者非常关注的话题。随着业务从单体架构向分布式架构演进以及部署方式的变化,服务之间的依赖关系变得越来越复杂,业务系统也面临着巨大的高可用挑战。大家可能都经历过以下的场景:演唱会抢票瞬间洪峰流量导致系统超出最大负载,load 飙高,用户无法正常下单;在线选...

  • LoongCollector:构建智能时代的数据采集新范式

    本文聚焦 LoongSuite 生态核心组件 LoongCollector,深度解析 LoongCollector 在智算服务中的技术突破,涵盖多租户观测隔离、GPU 集群性能追踪及事件驱动型数据管道设计,通过零侵入采集、智能预处理与自适应扩缩容机制,构建面向云原生 AI 场景的全栈可观测性基础设施,重新定义高并发、强异构环境下的可观测性能力边界。

  • 1
    ...
    51
    52
    53
    54
    55
    到第