2024-05-15
146

基于ASK+TFJob快速完成分布式Tensorflow训练任务

本文介绍如何使用TFJob在ASK+ECI场景下,快速完成基于GPU的TensorFlow分布式训练任务。

146
2024-05-15
148

基于SLS平台与日志审计构建Cloud SIEM方案

安全事件和事件管理(security information and event management,SIEM)通过对来自各种数据源安全事件的收集和分析,来实现威胁检测、安全事件管理和合规性检测。SIEM是在安全信息管理(SIM)——收集、分析并报告日志数据,与安全事件管理(SEM)——实时分析日志和事件数据以提供威胁监视、事件关联和事件响应的基础上发展而来的。本文为您介绍如何基于SLS平台与日志审计构建Cloud SIEM方案。

148
2024-05-15
96

企业SaaS应用加速网络场景最佳实践

企业分支通过SAG接入阿里云SDWAN网络,企业本地员工能够通过阿里云SDWAN应用加速线路实现加速访问SaaS服务,目前方案只支持office365、salesforce、ZOOM,后续会考虑加速逐步增加其他三方应用。

96
2024-05-15
108

打造一个高可用多租户的企业级Maven私有仓库服务

本文讨论了构建高可用多租户企业级Maven私有仓库服务的必要性,指出传统Nexus和Artifactory开源版缺乏高可用性,商业版虽支持但成本高、扩展性有限。理想的解决方案应包含无状态节点、使用云存储(如阿里云OSS)和集群化的数据库与Elasticsearch。

108
2024-05-15
107

阿里巴巴服务框架三位一体的选择与实践

服务框架就像铁路的铁轨一样,是互通的基础,只有解决了服务框架的互通,才有可能完成更高层的业务互通,所以用相同的标准统一,合二为一并共建新一代的服务框架是必然趋势。Dubbo3 是Dubbo2 与 HSF 融合而来,是阿里经济体面向内部业务、商业化、开源的唯一标准服务框架。

107
2024-05-15
72

全面容器化之后,来电科技实现微服务治理

MSE 服务治理帮助我们系统以很低的成本无侵入的方式快速实现了全链路灰度能力,进一步提升了我们系统的稳定性,让我们新需求的迭代上线更加地安心。-- 来电科技架构师 汤长征

2024-05-15
85

大规模 Spring Cloud 微服务无损上下线探索与实践

“从一次常见的发布说起,在云上某个系统应用发布时,重启阶段会导致较大数量的 OpenAPI、上游业务的请求响应时间明显增加甚至超时失败。随着业务的发展,用户数和调用数越来越多,该系统又一直保持一周发布二次的高效迭代频率,发布期间对业务的影响越来越无法接受,微服务下线的治理也就越来越紧迫。”

2024-05-15
99

阿里云SLS 容器采集全面兼容Kubernetes

iLogtail致力于打造覆盖Trace、Metrics 以及Logging 的可观测性的统一Agent,而对Kubernetes 语义的原生支持大大增强了Log在Kubernetes场景的采集体验。

99
2024-05-15
113

通过HBR实现NAS容灾方案

本文介绍如何基于NAS+云上备份HBR实现云文件数据容灾。

113
1
...
13
14
15
...
18
到第
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
14/18