什么是Elastic Stack:更全面的一体化监控运维平台?
在监控领域, 需要收集和处理三类数据:性能数据(Metrics)、日志数据(Logs)、应用调用 链数据(Trace)。以往,大家在这三个方面都是使用不同产品去做的。比如性 能指标数据,传统行业使用 Zabbix 比较多,互联网使用新兴的 Prometheus、 OpenFalon 等。而日志方面,又自成一体,大家有不同的方案,比如商业产品 Splunk、开源 ELK。APM 工具更是百花齐放。这三类数据通常相互割裂互成 孤岛,而实际上,我们线上运维通常希望这些数据能够打通和关联起来。Elastic 有个比较好的思路,借助 Elastic Common Schema (ECS) 等规范化工具,将 性能数据(Metrics)、日志数据(Logs)、应用调用链数据(Trace)三类数据标 准化,整合到一起,形成一体化的监控解决方案。运用这样的产品,运维工程师 可以非常自然的在不同数据之间进行跳转和关联分析。目前 Elastic 已经陆续推出 了 Metrics、APM 等方案,但在规模化应用场景下还是存在底层存储成本方面的 问题,对于海量 metric 和 trace 数据,存储代价还是很高的。当然 Elastic 也作 出了努力,比如针对 metrics 推出了 Rollup 功能,类似准实时的流式计算,在数 据写入阶段通过预置规则,对数据做实时聚合后再存储,可以实时把数据做聚合 后再存储,以减少存储开销。当未来 Elastic 能够更好的解决数据存储成本问题 后,可能成为优秀的一体化监控运维产品。另外,Elastic 引入了机器学习,对 监控数据做智能化的异常检测和预测,顺应了监控系统 AI 化的发展趋。
资源来源于《Elasticsearch 中国开发者调查报告》下载地址:https://developer.aliyun.com/topic/download?id=59
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。