官方博客-第59页-阿里云开发者社区

  • 2024-05-15
    486

    基于ASK+TFJob快速完成分布式Tensorflow训练任务

    本文介绍如何使用TFJob在ASK+ECI场景下,快速完成基于GPU的TensorFlow分布式训练任务。

    486
  • 2024-05-15
    588

    统一观测|Prometheus 监控多云容器集群

    容器集群可观测现状随着 Kubernetes(K8s)容器编排工具已经成为事实上行业通用技术底座,容器集群监控经历多种方案实践后,Prometheus 最终成为容器集群监控的事实标准。Promethues 监控服务可有效监控系统层指标、应用层指标、业务层指标等,采集监控指标后进行存储,搭配 Graf...

  • 2024-05-15
    460

    大规模 Spring Cloud 微服务无损上下线探索与实践

    “从一次常见的发布说起,在云上某个系统应用发布时,重启阶段会导致较大数量的 OpenAPI、上游业务的请求响应时间明显增加甚至超时失败。随着业务的发展,用户数和调用数越来越多,该系统又一直保持一周发布二次的高效迭代频率,发布期间对业务的影响越来越无法接受,微服务下线的治理也就越来越紧迫。”

    460
  • 2024-05-15
    295

    一键式开启:IDaaS日志接入SLS日志审计发布

    应用身份服务IDaaS(Identity as a Service)是阿里云原生身份管理系统,可以统一管理各应用中分散的账号,并集中分配应用访问控制权限,降低低效、重复的账号访问配置和运维工作。

    295
  • 2024-05-15
    580

    ACK场景下应用程序安全访问云资源最佳实践

    在实际的容器安全实践中,怎么样避免应用程序永久访问密钥。本文会介绍基于云原生的产品能力来实现无AK方案。

    580
  • 2024-05-15
    759

    安全防御四部曲---检测实践方案 (多产品结合)

    本次方案主要是针对阿里云国际站客户,企业在实际使用阿里云的过程中如何做好运维检测的一些多产品结合的方案介绍。 本篇文章的重点会放在检测(Detection)部分,会具体介绍涉及使用产品配置,FAQ等等,同时对整体的理论框架进行简单的介绍,帮助大家更好理解本部分在运维工作中的分属情况,更好的建立整体性的概念。

    759
  • 2024-05-15
    567

    通过 SLS 实现日志大数据入湖 OSS

    数据湖技术在日志生态中扮演不可或缺的角色,而打通日志从生产端到数据湖的链路却比较复杂。本文将介绍基于 SLS 方案为日志入湖提供端到端(End-to-End)支持,帮助用户提升接入效率,并在费用、运维上有效降低成本。

    567
  • 2024-05-15
    649

    线上故障突突突?如何紧急诊断、排查与恢复

    本文简单介绍了阿里云上关于故障恢复、诊断的一些最佳实践。

    649
  • 2024-05-15
    271

    无需重启应用,动态采集任意点位日志

    借助日志治理的现有能力,我们能够在不重启应用的前提下,动态采集任意点位信息,同时由于日志治理在采集信息时会引入链路信息,在分析复杂调用问题时能够起到很好的效果。

    271
  • 1
    ...
    58
    59
    60
    61
    62
    到第