2024-05-15
177

基于ASK+TFJob快速完成分布式Tensorflow训练任务

本文介绍如何使用TFJob在ASK+ECI场景下,快速完成基于GPU的TensorFlow分布式训练任务。

177
2024-05-15
180

基于业务的告警管理最佳实践

本文主要介绍了SLS告警管理中心的业务概念和功能。

180
2024-05-15
193

基于SLS平台与日志审计构建Cloud SIEM方案

安全事件和事件管理(security information and event management,SIEM)通过对来自各种数据源安全事件的收集和分析,来实现威胁检测、安全事件管理和合规性检测。SIEM是在安全信息管理(SIM)——收集、分析并报告日志数据,与安全事件管理(SEM)——实时分析日志和事件数据以提供威胁监视、事件关联和事件响应的基础上发展而来的。本文为您介绍如何基于SLS平台与日志审计构建Cloud SIEM方案。

193
2024-05-15
156

通过HBR实现NAS容灾方案

本文介绍如何基于NAS+云上备份HBR实现云文件数据容灾。

156
2024-05-15
220

SLS:使用 OTel 官方 SDK 采集 Android、iOS Trace 数据实践

本文介绍了使用 OTel 官方 SDK 采集 Android、iOS Trace 数据实践。

220
2024-05-15
157

【Terraform实现云服务基础设施既代码(IaC)案例实战-2】:通过Terraform实施基础IaC

前言树苗科技公司业务上云2年有余,随着技术的不断发展。运维团队支持业务变更配置、开资源、删资源等过程加班到深夜一两点已是家常便饭。为了进一步提升工作效率,运维总监张三决定对当前业务交付路径进行统一梳理,借助IaC的理念和Terraform自动化工具逐步实施运维生产自动化,改善组内成员频繁加班的现状。...

157
2024-05-15
169

ACK场景下应用程序安全访问云资源最佳实践

在实际的容器安全实践中,怎么样避免应用程序永久访问密钥。本文会介绍基于云原生的产品能力来实现无AK方案。

169
2024-05-15
152

Kubernetes 文件采集实践:Sidecar + hostPath 卷

在Kubernetes 日志查询分析实践中,我们介绍了如何通过 DaemonSet 方式部署 logtail 并采集标准输出/文件两种形式的数据。DaemonSet 部署的优势在于其能够尽可能地减少采集 agent 所占用的资源且支持标准输出采集,但因为每个 DaemonSet pod 需要负责 n...

152
2024-05-15
168

某海外视频网站AWS S3 搬迁至OSS解决方案

某网站主体位于AWS,经营视频直播/点播以及其他互联网衍生业务,面向广大的海外手机端客户。目前已经在使用阿里云的VOD SDK,并将主要视频数据存放于S3。现需要将业务从AWS S3迁移至阿里云OSS。

168
1
...
5
6
7
8
9
到第
1
2
3
4
5
6
7
8
9
7/9