带你读《CloudOps云上自动化运维 白皮书2.0》之22:5.工具推荐(上)

本文涉及的产品
轻量应用服务器 2vCPU 1GiB,适用于搭建电商独立站
轻量应用服务器 2vCPU 4GiB,适用于搭建Web应用/小程序
轻量应用服务器 2vCPU 4GiB,适用于网站搭建
简介: 带你读《CloudOps云上自动化运维 白皮书2.0》之22:5.工具推荐(上)


5. 工具推荐

 

1) 阿里云相关工具

 

从基础设施可靠性、数据可靠性到应用可观测性、APM、自助诊断、弹性容错能力等服务可靠性,阿里云都提供了完备的产品解决方案。用户可以利用这一系列能力,提升自身服务的可靠性。

 

全球化超级数据中心

 

阿里云基础设施目前已面向全球四大洲,开服运营25个公共云地域、80个可用区,此外还拥有4个金融云、政务云专属地域,并且致力于持续的新地域规划和建设。通过全球化的布局、超级规模的数据中心、持续的投入与深入布局来保障阿里云基础设施坚实、可靠。

 

• 快照与自定义镜像

 

从块存储技术角度,阿里云的块存储设备在具备高性能和低时延的优势下,同时提供了极高SLA保障了数据的可靠性,其中云盘采用分布式三副本机制,为ECS实例提供99.9999999%的数据可靠性保证。

 

从数据备份与容灾恢复角度,阿里云提供了快照2.0技术,提供了更高的快照额度、更灵活的自动任务策略,并进一步降低了对业务I/O的影响,同时增量快照能力可以以更快的快照制作速度和更小的空间占用,帮助用户提升效率并降低成本。

 

用户可以通过自定义快照策略实现快照自动化备份,以极低的成本完成数据备份,在故障场景,用户可以通过控制台或者OpenAPI来手动或着自动化完成快照回滚、数据恢复。同样的原理适用于自定义镜像,用户可以通过镜像的制作、复制、恢复来完成数据备份、中转、恢复。

 

• 自助问题排查

 

阿里云的基础云产品服务比如ECS、RDS、虚拟网络均提供了云资源侧的自助诊断能力,以ECS和DAS诊断为例简单介绍。

 

ECS自助问题排查ECS自助问题排查提供的实例健康诊断、操作异常诊断、安全组规则检测、以及网络连通性诊断,可以全方位帮助用户诊断实例的操作系统配置、磁盘状态、网络配置、网络状态等配置异常,同时给予修复建议方案,帮助用户及时处理潜在风险。

 

数据库自治服务DAS(Database Autonomy Service)是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助您消除人工操作引发的服务故障,有效保障数据库服务的稳定、安全及高效。

 

• 云监控CMS

 

云监控服务可用于收集获取阿里云资源的监控指标或用户自定义的监控指标,探测服务可用性以及针对指标设置警报。使您全面了解阿里云上的资源使用情况、业务的运行状况和健康度,并及时收到异常报警做出反应,保证应用程序顺畅运行。

 

基础监控:云上云下统一的主机监控解决方案及百余款云产品监控。

网络监控:基于私网和公网的网络可用性监控。

业务监控:过日志监控、自定义监控把业务数据归集到云上进行统一监控和管理。

 

• 日志服务SLS

 

日志服务(SLS)是云原生观测分析平台,为Log/Metric/Trace等数据提供大规模、低成本、实时平台化服务。一站式提供数据采集、加工、分析、告警可视化与投递功能,全面提升研发、运维、运营和安全等场景数字化能力。作为云原生观测分析平台。

 

数据采集支持Log/Metric/Trace统一采集,支持服务器/应用/移动设备/网页/IoT等数据源接入,支持阿里云产品/开源系统/云间/云下日志数据接入。

 

数据加工通过灵活语法,在不编写代码情况下支持各种复杂数据提取、解析、富化、分发等需求,支持结构化分析。

 

查询分析提供关键词、SQL92、AIOps函数等多种方式,支持面向文本+结构化数据实时查询分析,异常巡检与智能分析。

 

监控告警具备丰富的可视化组件,可创建所见即所得的交互式分析大盘。同时支持实时可编排的告警功能,可随时随地掌握业务动向。

 

日志审计账户下实时自动化、中心化采集云产品日志并进行审计,支持升级所需合规存储、查询及信息汇总报表。

 

投递与消费与各种实时计算及服务实时对接,并可以实现自定义消费。支持数据投递至存储类服务,支持压缩、自定义Partition以及行列等各种存储格式。

 


《CloudOps云上自动化运维 白皮书2.0》—— 六、可靠性能力Reliabilty——5.工具推荐(下):https://developer.aliyun.com/article/1222464?groupCode=ecs


相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
4月前
|
运维 Prometheus 监控
别再盲选了!开源运维工具选型这事儿,咱得说人话
别再盲选了!开源运维工具选型这事儿,咱得说人话
220 7
|
3月前
|
运维 Prometheus 监控
3 年部署经验总结:用自动化工具轻松管理 300+ 服务器开源软件
三年前接手公司IT部门时,我满怀信心,却发现部署效率低下。尽管使用了GitLab、Jenkins、Zabbix等100+开源工具,部署仍耗时费力。文档厚重如百科,却难解实际困境。一次凌晨三点的加班让我下定决心改变现状。偶然看到一篇国外博客,介绍了自动化部署的高效方式,我深受启发。
173 0
|
2月前
|
机器学习/深度学习 人工智能 测试技术
EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读
EdgeMark是一个面向嵌入式AI的自动化部署与基准测试系统,支持TensorFlow Lite Micro、Edge Impulse等主流工具,通过模块化架构实现模型生成、优化、转换与部署全流程自动化,并提供跨平台性能对比,助力开发者在资源受限设备上高效选择与部署AI模型。
295 9
EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读
|
1月前
|
人工智能 搜索推荐 UED
一个牛逼的国产AI自动化工具,开源了 !
AiPy是国产开源AI工具,结合大语言模型与Python,支持本地部署。用户只需用自然语言描述需求,即可自动生成并执行代码,轻松实现数据分析、清洗、可视化等任务,零基础也能玩转编程,被誉为程序员的智能助手。
|
2月前
|
Java 测试技术 API
自动化测试工具集成及实践
自动化测试用例的覆盖度及关键点最佳实践、自动化测试工具、集成方法、自动化脚本编写等(兼容多语言(Java、Python、Go、C++、C#等)、多框架(Spring、React、Vue等))
124 6
|
3月前
|
人工智能 数据可视化 数据挖掘
团队日报不用愁!自动化生成工具亲测:任务进度实时同步
本文深入分析了传统手动日报在数据孤岛、格式混乱和时效性差三大痛点,并探讨了自动化日报带来的效率提升、决策优化等四大核心价值。通过对板栗看板、SmartBrief、n8n 等六款主流工具的功能、适用场景及实战效果进行测评,为企业提供科学的选型建议与实施路径。
团队日报不用愁!自动化生成工具亲测:任务进度实时同步
|
1月前
|
人工智能 缓存 自然语言处理
86_自动化提示:AutoPrompt工具
在当今人工智能领域,提示工程(Prompt Engineering)已成为释放大语言模型(LLM)潜能的关键技术。随着LLM规模和能力的不断增长,如何设计高效、精确的提示词成为研究和应用的焦点。然而,传统的手工提示工程面临着巨大挑战
|
3月前
|
人工智能 供应链 数据可视化
工作流梳理工具实战教程:手把手教你绘制第一张自动化流程图
本文剖析了团队因流程混乱导致重复劳动和效率低下的问题,提出通过工作流梳理提升协作效率的解决方案。总结了流程梳理的六大核心需求,并深度测评了6款主流工具,国内有板栗看板那,国外有kiss flow结合团队规模与需求提供选型建议,助力企业高效落地流程优化。
|
2月前
|
安全 搜索推荐 机器人
风险规则引擎-RPA 作为自动化依赖业务决策流程的强大工具
机器人流程自动化(RPA)是一种通过软件“机器人”自动执行重复性任务的技术,能大幅提升工作效率。它适用于财务、电商等领域的标准化流程,如账单处理和退货管理。然而,RPA在复杂决策场景中存在局限,需结合决策模型(DMN)和业务规则管理系统(BRMS)实现流程与决策的协同自动化,从而增强灵活性与业务价值。

热门文章

最新文章