带你读《CloudOps云上自动化运维 白皮书2.0》之22:5.工具推荐(上)

本文涉及的产品
云服务器 ECS,u1 2核4GB 3个月
云服务器 ECS,每月免费额度200元 3个月
云服务器 ECS,u1 4核8GB 1个月
简介: 带你读《CloudOps云上自动化运维 白皮书2.0》之22:5.工具推荐(上)


5. 工具推荐

 

1) 阿里云相关工具

 

从基础设施可靠性、数据可靠性到应用可观测性、APM、自助诊断、弹性容错能力等服务可靠性,阿里云都提供了完备的产品解决方案。用户可以利用这一系列能力,提升自身服务的可靠性。

 

全球化超级数据中心

 

阿里云基础设施目前已面向全球四大洲,开服运营25个公共云地域、80个可用区,此外还拥有4个金融云、政务云专属地域,并且致力于持续的新地域规划和建设。通过全球化的布局、超级规模的数据中心、持续的投入与深入布局来保障阿里云基础设施坚实、可靠。

 

• 快照与自定义镜像

 

从块存储技术角度,阿里云的块存储设备在具备高性能和低时延的优势下,同时提供了极高SLA保障了数据的可靠性,其中云盘采用分布式三副本机制,为ECS实例提供99.9999999%的数据可靠性保证。

 

从数据备份与容灾恢复角度,阿里云提供了快照2.0技术,提供了更高的快照额度、更灵活的自动任务策略,并进一步降低了对业务I/O的影响,同时增量快照能力可以以更快的快照制作速度和更小的空间占用,帮助用户提升效率并降低成本。

 

用户可以通过自定义快照策略实现快照自动化备份,以极低的成本完成数据备份,在故障场景,用户可以通过控制台或者OpenAPI来手动或着自动化完成快照回滚、数据恢复。同样的原理适用于自定义镜像,用户可以通过镜像的制作、复制、恢复来完成数据备份、中转、恢复。

 

• 自助问题排查

 

阿里云的基础云产品服务比如ECS、RDS、虚拟网络均提供了云资源侧的自助诊断能力,以ECS和DAS诊断为例简单介绍。

 

ECS自助问题排查ECS自助问题排查提供的实例健康诊断、操作异常诊断、安全组规则检测、以及网络连通性诊断,可以全方位帮助用户诊断实例的操作系统配置、磁盘状态、网络配置、网络状态等配置异常,同时给予修复建议方案,帮助用户及时处理潜在风险。

 

数据库自治服务DAS(Database Autonomy Service)是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助您消除人工操作引发的服务故障,有效保障数据库服务的稳定、安全及高效。

 

• 云监控CMS

 

云监控服务可用于收集获取阿里云资源的监控指标或用户自定义的监控指标,探测服务可用性以及针对指标设置警报。使您全面了解阿里云上的资源使用情况、业务的运行状况和健康度,并及时收到异常报警做出反应,保证应用程序顺畅运行。

 

基础监控:云上云下统一的主机监控解决方案及百余款云产品监控。

网络监控:基于私网和公网的网络可用性监控。

业务监控:过日志监控、自定义监控把业务数据归集到云上进行统一监控和管理。

 

• 日志服务SLS

 

日志服务(SLS)是云原生观测分析平台,为Log/Metric/Trace等数据提供大规模、低成本、实时平台化服务。一站式提供数据采集、加工、分析、告警可视化与投递功能,全面提升研发、运维、运营和安全等场景数字化能力。作为云原生观测分析平台。

 

数据采集支持Log/Metric/Trace统一采集,支持服务器/应用/移动设备/网页/IoT等数据源接入,支持阿里云产品/开源系统/云间/云下日志数据接入。

 

数据加工通过灵活语法,在不编写代码情况下支持各种复杂数据提取、解析、富化、分发等需求,支持结构化分析。

 

查询分析提供关键词、SQL92、AIOps函数等多种方式,支持面向文本+结构化数据实时查询分析,异常巡检与智能分析。

 

监控告警具备丰富的可视化组件,可创建所见即所得的交互式分析大盘。同时支持实时可编排的告警功能,可随时随地掌握业务动向。

 

日志审计账户下实时自动化、中心化采集云产品日志并进行审计,支持升级所需合规存储、查询及信息汇总报表。

 

投递与消费与各种实时计算及服务实时对接,并可以实现自定义消费。支持数据投递至存储类服务,支持压缩、自定义Partition以及行列等各种存储格式。

 


《CloudOps云上自动化运维 白皮书2.0》—— 六、可靠性能力Reliabilty——5.工具推荐(下):https://developer.aliyun.com/article/1222464?groupCode=ecs


相关实践学习
ECS云服务器新手上路
本实验会自动创建一台ECS实例。首先,远程登陆ECS实例,并部署应用。然后,登陆管理控制台,并对这台ECS实例进行管理操作。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
1天前
|
Java jenkins 持续交付
Jenkins是开源CI/CD工具,用于自动化Java项目构建、测试和部署。通过配置源码管理、构建触发器、执行Maven目标,实现代码提交即触发构建和测试
【7月更文挑战第1天】Jenkins是开源CI/CD工具,用于自动化Java项目构建、测试和部署。通过配置源码管理、构建触发器、执行Maven目标,实现代码提交即触发构建和测试。成功后,Jenkins执行部署任务,发布到服务器或云环境。使用Jenkins能提升效率,保证软件质量,加速上线,并需维护其稳定运行。
11 0
|
3天前
|
Java 测试技术 持续交付
现代软件测试中的自动化工具与挑战
随着软件开发的复杂性增加,自动化测试工具在现代软件测试中发挥着越来越重要的作用。本文将探讨自动化测试工具的种类及其应用领域,分析在实际应用中可能面临的挑战,并提出应对策略,以期帮助开发团队更好地利用自动化测试提升软件质量。
10 0
|
12天前
|
Java 测试技术 C#
几个好用的自动化测试工具总结
【6月更文挑战第4天】几个好用的自动化测试工具总结
27 0
|
12天前
|
机器学习/深度学习 人工智能 机器人
现代软件测试中的自动化工具与技术
随着软件开发复杂性的增加,自动化测试在现代软件开发中变得至关重要。本文探讨了当前流行的自动化测试工具和技术,以及它们如何提高软件质量、加快发布速度和降低成本。
22 1
|
12天前
|
jenkins 测试技术 持续交付
软件测试的自动化:工具与策略的探索
【6月更文挑战第20天】探索软件测试自动化:强调效率、一致性与持续集成。Selenium、Appium、Postman和Jenkins等工具助力自动化测试,策略包括明确测试目标、选对工具、编写优质用例和持续集成。自动化测试优化软件质量,提升团队能力,适应快速发展的行业需求。
|
13天前
|
机器人 测试技术 持续交付
现代软件测试中的自动化工具与策略
随着软件开发的快速发展,自动化测试成为提高软件质量和加快发布速度的关键。本文探讨了现代软件测试中自动化工具和策略的重要性及其应用,旨在帮助开发团队更有效地实施自动化测试,提升整体开发效率和产品质量。
|
14天前
|
运维 应用服务中间件 数据库
深入解析现代运维中的自动化工具应用
在现代运维领域,自动化工具成为提高工作效率和降低人为错误的关键因素。本文将探讨几种常见的运维自动化工具,它们的功能、优势及其在实际应用中的案例,以期为运维人员提供有价值的参考。
12 0
|
18天前
|
机器学习/深度学习 人工智能 jenkins
探索自动化测试工具的选择与应用
在软件开发生命周期中,软件测试是确保质量的重要环节。随着自动化技术的发展,自动化测试工具的选择和应用变得至关重要。这篇文章将深入探讨如何选择适合的自动化测试工具,并结合实例分析其实际应用效果,从而为开发团队提供有效的指导。
|
19天前
|
人工智能 搜索推荐 API
开源2.0|从事视频剪辑的“熬者们”,自动化剪辑工具 FunClip请收好
开源2.0|从事视频剪辑的“熬者们”,自动化剪辑工具 FunClip请收好
开源2.0|从事视频剪辑的“熬者们”,自动化剪辑工具 FunClip请收好
|
20天前
|
人工智能 运维 监控
现代化运维管理下的自动化工具应用
传统的运维管理往往依赖人工操作,效率低下且容易出现错误。随着科技的进步,现代化运维管理越来越重视自动化工具的应用。本文将介绍几种在现代化运维管理中广泛应用的自动化工具,并分析它们对提高运维效率和降低风险的重要性。
23 0