官方博客-第66页-阿里云开发者社区

  • 2024-05-15
    486

    基于ASK+TFJob快速完成分布式Tensorflow训练任务

    本文介绍如何使用TFJob在ASK+ECI场景下,快速完成基于GPU的TensorFlow分布式训练任务。

    486
  • 2024-05-15
    588

    统一观测|Prometheus 监控多云容器集群

    容器集群可观测现状随着 Kubernetes(K8s)容器编排工具已经成为事实上行业通用技术底座,容器集群监控经历多种方案实践后,Prometheus 最终成为容器集群监控的事实标准。Promethues 监控服务可有效监控系统层指标、应用层指标、业务层指标等,采集监控指标后进行存储,搭配 Graf...

  • 2024-05-15
    998

    链路追踪(Tracing)其实很简单——链路功能进阶指南

    经过前面两章的学习,小玉已经熟练掌握分布式链路追踪的基础用法,比如回溯链路请求轨迹,定位耗时瓶颈点;配置核心接口黄金三指标告警,第一时间发现流量异常;大促前梳理应用上下游关键依赖,联系相关方协同备战等等。随...

    998
  • 2024-05-15
    460

    大规模 Spring Cloud 微服务无损上下线探索与实践

    “从一次常见的发布说起,在云上某个系统应用发布时,重启阶段会导致较大数量的 OpenAPI、上游业务的请求响应时间明显增加甚至超时失败。随着业务的发展,用户数和调用数越来越多,该系统又一直保持一周发布二次的高效迭代频率,发布期间对业务的影响越来越无法接受,微服务下线的治理也就越来越紧迫。”

    460
  • 2024-05-15
    643

    统一观测丨使用 Prometheus 监控云原生网关,我们该关注哪些指标?

    MSE 云原生网关默认提供了丰富的 Metrics 指标大盘,配合阿里云 Prometheus 监控提供开箱即用的完整可观测性能力,能够帮助用户快捷、高效的搭建自身的微服务网关与对应的可观测体系。

    643
  • 2024-05-15
    295

    一键式开启:IDaaS日志接入SLS日志审计发布

    应用身份服务IDaaS(Identity as a Service)是阿里云原生身份管理系统,可以统一管理各应用中分散的账号,并集中分配应用访问控制权限,降低低效、重复的账号访问配置和运维工作。

    295
  • 2024-05-15
    580

    ACK场景下应用程序安全访问云资源最佳实践

    在实际的容器安全实践中,怎么样避免应用程序永久访问密钥。本文会介绍基于云原生的产品能力来实现无AK方案。

    580
  • 2024-05-15
    483

    使用ECS通过Syslog协议投递日志到SIEM

    Syslog是一个常见的日志通道,几乎所有的SIEM(例如IBM Qradar, HP Arcsight)都支持通过Syslog渠道接收日志。本文主要介绍如何通过Syslog将日志服务中的日志投递到SIEM。

    483
  • 2024-05-15
    759

    安全防御四部曲---检测实践方案 (多产品结合)

    本次方案主要是针对阿里云国际站客户,企业在实际使用阿里云的过程中如何做好运维检测的一些多产品结合的方案介绍。 本篇文章的重点会放在检测(Detection)部分,会具体介绍涉及使用产品配置,FAQ等等,同时对整体的理论框架进行简单的介绍,帮助大家更好理解本部分在运维工作中的分属情况,更好的建立整体性的概念。

    759
  • 1
    ...
    65
    66
    67
    ...
    70
    到第