用积木讲运维,这样的IT人太会了

本文涉及的产品
对象存储 OSS,20GB 3个月
云备份 Cloud Backup,100GB 3个月
阿里云盘企业版 CDE,企业版用户数5人 500GB空间
简介: 日志服务SLS提供数据采集、加工、分析、告警可视化与投递功能,为AIOps、大数据分析、运营服务、大数据安全等场景提供支撑,并能以搭积木的方式适配各类运维场景,辅助企业的IT决策。近日,日志服务SLS新增了两项重磅功能,有助于进一步提升研发、运维等场景数字化能力。

积木的拼搭,是件细致工作。用不同的积木,进行组合变换,小孩子可能会用积木搭高楼、搭汽车、搭公路,而IT人则选择通过搭建小积木,讲解可观测的大乾坤。

积木1-裁剪.png

大家所熟知的日志服务SLS不只是日志存储,更是一个一站式智能运维方案、可观测平台。它提供数据采集、加工、分析、告警可视化与投递功能,为AIOps、大数据分析、运营服务、大数据安全等场景提供支撑,并能以搭积木的方式适配各类运维场景,辅助企业的IT决策。

整体介绍-裁剪.png

近日,日志服务SLS新增了两项重磅功能,有助于进一步提升研发、运维等场景数字化能力。


一、日志服务架构的五大层级


相关报告指出,可观测性应用使企业机构能够利用其数据特征来获得竞争优势。如果能够在战略中予以规划并成功执行,可观测性应用将成为数据驱动型决策的最强大来源。

 

从架构上来看,日志服务SLS作为一站式的云原生可观测分析平台,按功能可划分为5大层级。最底层是数据采集与管道,再上一层是统一的可观测存储平台;然后是灵活的高性能计算引擎、智能化的Ops平台工具;最上层为各种开箱即用的功能。

架构图.png

1、数据采集与管道

业内公认,LogMetricTrace是全观测的三大支柱,通过搭建统一的观测系统,帮助运维人员在「事前」了解系统运行状态,「事中」快速定位故障,「事后」根因分析,做到进退有方,心中不慌。

 

SLS作为阿里巴巴、蚂蚁等日志中台产品,可以承载流量管道作用,为Log/Metric/Trace等数据提供大规模、低成本、实时平台化服务。


2、可观测存储平台

 

针对不同类型的数据,SLS提供了统一的存储能力,日志中枢(LogHub)支持与各种实时计算及服务对接,不但可以提供完整的进度监控,报警等功能,还能根据SDK/API实现自定义消费。此外,SLS具备强大的数据加工能力,广泛适用于数据的规整、富化、分发、汇总、重建索引等场景。

 

为了降低用户长周期存储的成本,SLS提供了冷存储功能。冷存储数据的存储费用很低,冷热数据转换也不会产生费用。

 

3、高性能计算引擎

 

SLS有不少互联网及企业客户,他们的业务系统会实时生成大量的埋点日志数据,这些数据往往需要长期保存,并且有离线计算或者实时计算的需求。

 

为了更好地服务这些客户, SLS提供了基于索引的高性能查询/分析能力,10亿级数据能够实现秒级返回。在语法上,SLS完全兼容SQL92标准,同时无缝对接主流(FlinkSparkStorm等)流计算产品。

 

4、智能化的 Ops 平台工具

 

SLS支持完整AIOps能力,能将可观测性数据全部接入一个平台中,再结合高性能数据查询引擎、关联分析能力,构建出一套云原生可观测平台。

 

用户可以基于此平台, 便捷高效地构建ITOpsSecOpsFinOps上层应用。再结合智能告警与响应中枢、基于AI的数据分析与异常巡检模块,企业IT系统神经中枢就大功告成了。

 

5、开箱即用的应用

 

SLS具备全托管、免运维,开箱即用的特性,提供DSL编排能力,内置200+函数,内置算子,能够快速实现二次开发。


Cloud Lens 复用了SLS 的存储分析平台,可以跨账号、跨区域统一采集访问日志、用量数据、监控指标等可观测数据,继而创建一个统一的场景化洞察大盘,帮助用户低门槛实现对云产品的可观测。


二、日志服务新增查询型规格以及Scan扫描模式

 

SLS现有的标准型规格(Standard Logstore),包含了SLS的完整功能集合,用户可以在标准型规格上实现对于数据的高性能查询与分析,进而用来适应各类业务场景。但实际上部分用户的业务场景并不倚重于分析能力,更多的还是依赖查询解决问题。

查询型-裁剪.png

哲学家老子曾说大道至简,同样地,产品也需要因事制宜做“减法”。因此,SLS新推出了查询型规格(Query Logstore),据统计,查询型规格索引流量费用相比标准型规格减少约72%,综合成本预计降低30% ,支持高性能查询,不支持分析统计。适合于debugging、问题诊断和审计溯源等重查询轻(或无)分析的场景。

 

在同一个project下,可以同时保有标准型及查询型规格Logstore,用户可根据不同业务需求灵活组合。SLS Query规格还支持存储冷热分层,在兼容查询功能的同时进一步降低成本。

在查询型规格之外,SLS今年在计算引擎上也实现了重大突破。索引查询/分析模式是一种schema-on-write的模式,更注重稳定和效率,相对应的需要提前建立索引,没有索引的字段就无法用于做查询分析,适用于明确有业务需求的日志字段。但是对于需求相对模糊的部分,往往会让用户陷入是应该注重业务需求提前建索引,还是应该平衡成本的纠结中。

Scan模式-裁剪.png

而SLS推出的扫描查询/分析模式(Schema on read),不需要用户提前建立索引,在无预建索引的情况下可以实现轻量级(性能/规模受限)的查询分析功能,相对应的成本也会大幅度降低。在同一份日志数据中,通过两种计算模式的灵活结合,SLS成功化身“端水大师”,实现对于业务需求和成本的兼具考虑。

 

结语:起早与贪黑齐飞,调休共假期待定,那是人肉运维。进入智能运维时代,运维人需要的是文能运维做观测,武能检索做分析。有了可以灵活组装底层能力的日志服务SLS,运维人可以进一步从繁重的事务中解脱出来。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
5天前
|
机器学习/深度学习 存储 人工智能
智能化运维:AI在IT管理中的应用与挑战
【7月更文挑战第22天】在数字化转型的浪潮中,智能化运维成为企业追求效率和创新的关键。本文将深入探讨人工智能(AI)技术如何在IT运维领域发挥作用,包括自动化故障检测、预测性维护、以及智能决策支持等。同时,文章也将揭示AI运维面临的挑战,如数据隐私保护、模型可解释性和高成本投入等问题,并提出相应的解决策略。
|
19天前
|
机器学习/深度学习 人工智能 运维
自动化运维在现代IT架构中的关键角色
【7月更文挑战第8天】随着技术的快速发展,自动化运维成为企业追求高效、稳定IT服务的重要策略。本文将探讨自动化运维如何优化工作流程、提升系统稳定性和安全性,以及它在现代IT架构中不可或缺的地位。
29 1
|
3天前
|
机器学习/深度学习 运维 监控
智能化运维的崛起:机器学习在IT管理中的实践与挑战
本文深入探讨了智能化运维领域,特别是机器学习技术在IT管理中的应用。文章首先介绍了智能化运维的概念及其重要性,随后详细阐述了机器学习在故障预测、自动化响应和系统优化中的作用。同时,文章也指出了实施智能化运维时可能遇到的技术挑战和数据治理问题,并提出了相应的解决策略。最后,通过具体案例分析,展示了机器学习技术如何在实际运维中提高系统稳定性和效率。
|
3天前
|
机器学习/深度学习 边缘计算 运维
智能化运维的崛起:机器学习在IT基础设施管理中的应用
随着企业对IT基础设施的依赖日益加深,传统的运维模式已难以满足现代业务的需求。本文将探讨智能化运维的概念,分析机器学习技术如何革新IT基础设施的管理方式,提升运维效率,并预测其在未来运维领域的发展趋势。通过具体案例,本文旨在展示智能化运维的实践价值及其对企业数字化转型的推动作用。
16 0
|
5天前
|
运维 监控 安全
自动化运维:提升企业IT效率的秘诀
在数字化浪潮不断推进的当下,企业对IT运维的要求越来越高。本文将深入探讨自动化运维如何成为企业提升IT效率、确保业务连续性的关键策略。通过分析自动化工具的应用实例和统计数据,我们将揭示自动化运维在减少人为错误、缩短故障恢复时间以及优化资源配置等方面的巨大潜力。文章还将讨论实施自动化运维的挑战与对策,为企业提供一条明晰的自动化之路。
|
1天前
|
机器学习/深度学习 人工智能 运维
智能化运维:如何利用AI和机器学习优化IT基础设施管理
随着技术的快速发展,传统的运维方法已无法满足现代企业的需求。本文将深入探讨如何通过人工智能(AI)和机器学习(ML)来革新IT基础设施的管理方式,提升效率并降低成本。我们将从实际案例出发,分析AI与ML在智能监控、故障预测、自动化修复等方面的应用,并讨论实施这些技术时面临的挑战与解决策略。
5 1
|
4天前
|
机器学习/深度学习 运维 监控
智能化运维:利用机器学习优化IT基础设施管理
【7月更文挑战第23天】在数字化时代的浪潮中,IT基础设施的复杂性日益增加,传统的运维方法已难以满足现代企业的需求。本文将探讨如何通过机器学习技术,实现智能化运维,提升IT基础设施的管理效率和响应速度。我们将从智能监控、自动化故障处理、预测性维护三个方面展开讨论,并结合实际案例,展示智能化运维在实际应用中的巨大潜力。
|
4天前
|
机器学习/深度学习 存储 数据采集
智能化运维:未来IT管理的关键转型
在数字化浪潮的推动下,企业对IT系统的稳定性、安全性和敏捷性提出了更高的要求。智能化运维,作为一种新兴的运维模式,正逐步成为解决传统运维痛点、提升运维效率的重要手段。本文将探讨智能化运维的核心价值、关键技术及其在现代IT管理中的应用实践,旨在为读者提供一个关于如何实现运维自动化和智能化的全面视角。
|
12天前
|
机器学习/深度学习 存储 运维
智能化运维:利用机器学习优化IT基础设施管理
随着企业对高效、自动化IT基础设施管理的需求日益增长,智能化运维已成为技术发展的前沿。本文将探讨如何通过机器学习算法预测系统故障、优化资源分配并实现自动化的故障恢复,从而提升运维效率和系统稳定性。我们将分析机器学习在智能运维中的应用案例,并讨论实施过程中的挑战与策略。 【7月更文挑战第15天】
26 8
|
11天前
|
运维 分布式计算 大数据
自动化运维的利剑:Ansible在现代IT架构中的应用
【7月更文挑战第16天】本文深入探讨了Ansible作为自动化运维工具的核心价值及其在现代IT架构中的多维度应用。我们将通过具体案例分析,揭示Ansible如何优化IT运维流程、提升工作效率,并讨论其在云环境、容器化及大数据处理等领域的创新应用。文章旨在为读者提供一套实用的Ansible应用策略,助力企业构建更加高效、稳定的IT运维体系。

热门文章

最新文章