【产品解读】阿里云 Elasticsearch 在日志场景中实现“低成本高性能”

简介: “日志数据”正逐步成为互联网公司的重要资产,基于对“日志数据”的挖掘与分析,已成为优化企业对业务的变现能力与技术迭代效率的利器。但面临如此海量的数据,你真的准备好了吗?

本文字数:1435
预计阅读:3~5分钟

您将了解:
1、数据写入导致的高并发集群打爆问题,如何解决?
2、TB、PB级数据如何降低存储成本?
3、原生Elasticsearch在时序查询上的瓶颈如何突破?
4、峰谷差异大,如何避免闲置成本?

image.png

【全链路云上Elastic Stack 全景图】100%兼容开源,9大独有能力

----> 直播回顾 | 请点击观看 :阿里云Elasticsearch日志增强版介绍

寻根问源


image.png

日志场景面临的问题

日志场景是Elasticsearch使用中较为常见的场景,而大量日志数据让企业在追求经济效应与性能效应的同时,对产品本身提出了更为苛刻的要求。

1、高并发写入问题:
Elasticsearch在日志数据写入过程中,会同时对主副分片同步写入,还会去写开销较大的trancelog,从而造成Elasticsearch在高并发写入的时候,对机器CPU以及I/0的性能开销提出了更高的要求。

2、高存储成本问题:
日志数据的存储,往往需要对海量的数据进行存储,起步数据量都是在TB级别,有的企业甚至达到了PB级,而为了数据容灾性,还需要保存至少一个副本,这将对存储带来进一步的成本压力。

3、时序分析性能差
由于Elasticsearch的查询特征,会查一遍所有的segment,当你做较大范围range以及复杂聚合时,他的性能瓶颈就会立马凸显出来。

4、弹性可伸缩问题
日志随着业务变化,往往伴随峰值、均值和谷值的出现,且差异较大,企业通常为了解决峰值问题,会堆较多的机器已便满足峰值需求,那么“均值”、“谷值”期间就会造成机器资源大量浪费。

对【症】下药


1、计算存储分离:大幅提升日志高并发写入能力

计算存储分离的前提是将Elasticsearch的所有节点存基于NFS共享存储。【如图】数据流的写入请求,会先写到主分片,再写入到共享存储,而NRT segment会拷贝到临时目录,那么主分片与副分片在读取时就会存在差异,主分片仅读取commit segmen A,和refresh segment B,副分片读取的A’、B’。

image.png

计算存储分离的【核心思路】

1、 索引分片一写多读,且仅保留一个副本数据,降低存储成本,提升写入性能。
2、 依赖云存储保证数据可靠性:CTF底层具备三副本冗余机制,对云业务是透明的,保障数据不丢失。同时阿里云在面对极端情况下,备有分钟级的OSS自动备份机制,进一步提升数据可靠性。
3、 状态与索引分离。
4、 通过IO fence机制保证数据一致性,避免主进程僵死情况下双写的问题。
5、 内存物理复制降低主备延迟,从分钟级,降低至毫秒级。

2、秒级弹性扩缩容:避免因日志峰谷导致的“资源闲置”

image.png

3、物理复制状态机:不写实时索引,也能保证数据时效性

image.png

最佳应用实践


image.png

案例展示(部分集群)

案例背景:在阿里云搜索业务线上,有很多集团内、外的客户,会使用我们各种底层服务。为了保障各个业务之间不受影响,我们会对这些服务做一系列的监控,通过采集大量复杂的Metric做大量聚合,建立Dashboard。但除了做Monitor,相伴而生一定会有告警,也就是Alarming,那么这样一套监控、告警平台,底下使用的就是我们量身定制的日志增强版Elasticsearch。

架构解读

1、运用MetricBeats采集大量Metric数据,通过Gateway,向Elasticsearch集群去传输数据,写入量大概是40W docs/s。
2、传输数据中,有冷、热数据的区分,就需要将冷、热数据做切分配置。
3、由于需要对数据容灾处理,我们将数据自动快照到OSS里。

案例说明

我们通过计算后发现,如果用开源的Elasticsearch做同样的事情,所付出的成本将是该方案的一倍之多。因为不光是阿里云Elasticsearch增强版存储更便宜,同时为了时序Metric的场景更高的聚合效率,我们对阿里云内核也做了一些优化。

你如果是基于开源自建的ES集群,为了能够在聚合查询时有更好的性能,最直接的方式是冗余更多的datenote,来保证性能,当然这样会带来更高的费用,阿里云日志增强版针对性的解决了这个问题,不需要冗余过多的datanote,举这个例子是为了更好的帮助大家理解阿里云Elasticsearch日志增强版的能力

这套服务在阿里云内部是适用的,我们也对外提供同样的能力,供大家选择。

“宗师级”能力对比


数据来源:真实POC数据,开源Elasticsearch与日志增强版对比

  • 同样性能,费用节约24%

image.png

  • 同样客户需求,性能优越140%,成本减少43%

image.png

  • 综合能力彰显“宗师级”

image.png

相关活动


日志增强版_测试申请.png

扫码关注公众号‘Elasticsearch技术’,收获大咖最佳行业应用经验

image.png

相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
相关文章
|
8月前
|
自然语言处理 监控 安全
阿里云发布可观测MCP!支持自然语言查询和分析多模态日志
阿里云可观测官方发布了Observable MCP Server,提供了一系列访问阿里云可观测各产品的工具能力,包含阿里云日志服务SLS、阿里云应用实时监控服务ARMS等,支持用户通过自然语言形式查询
1105 0
阿里云发布可观测MCP!支持自然语言查询和分析多模态日志
|
10月前
|
存储 消息中间件 缓存
MiniMax GenAI 可观测性分析 :基于阿里云 SelectDB 构建 PB 级别日志系统
基于阿里云SelectDB,MiniMax构建了覆盖国内及海外业务的日志可观测中台,总体数据规模超过数PB,日均新增日志写入量达数百TB。系统在P95分位查询场景下的响应时间小于3秒,峰值时刻实现了超过10GB/s的读写吞吐。通过存算分离、高压缩比算法和单副本热缓存等技术手段,MiniMax在优化性能的同时显著降低了建设成本,计算资源用量降低40%,热数据存储用量降低50%,为未来业务的高速发展和技术演进奠定了坚实基础。
449 1
MiniMax GenAI 可观测性分析 :基于阿里云 SelectDB 构建 PB 级别日志系统
|
10月前
|
域名解析 应用服务中间件 网络安全
阿里云个人博客外网访问中断应急指南:从安全组到日志的七步排查法
1. 检查安全组配置:确认阿里云安全组已开放HTTP/HTTPS端口,添加规则允许目标端口(如80/443),授权对象设为`0.0.0.0/0`。 2. 本地防火墙设置:确保服务器防火墙未阻止外部流量,Windows启用入站规则,Linux检查iptables或临时关闭防火墙测试。 3. 验证Web服务状态:检查Apache/Nginx/IIS是否运行并监听所有IP,使用命令行工具确认监听状态。 4. 测试网络连通性:使用外部工具和内网工具测试服务器端口是否开放,排除本地可访问但外网不可的问题。 5. 排查DNS解析:确认域名A记录指向正确公网IP,使用`ping/nslookup`验证解析正
389 2
|
12月前
|
存储 运维 监控
金融场景 PB 级大规模日志平台:中信银行信用卡中心从 Elasticsearch 到 Apache Doris 的先进实践
中信银行信用卡中心每日新增日志数据 140 亿条(80TB),全量归档日志量超 40PB,早期基于 Elasticsearch 构建的日志云平台,面临存储成本高、实时写入性能差、文本检索慢以及日志分析能力不足等问题。因此使用 Apache Doris 替换 Elasticsearch,实现资源投入降低 50%、查询速度提升 2~4 倍,同时显著提高了运维效率。
710 3
金融场景 PB 级大规模日志平台:中信银行信用卡中心从 Elasticsearch 到 Apache Doris 的先进实践
|
10月前
|
存储 机器学习/深度学习 人工智能
Elasticsearch:使用阿里云 AI 服务进行向量化和重新排名
本文介绍了如何将阿里云 AI 功能与 Elasticsearch 集成,以提高语义搜索的相关性。
645 0
|
10月前
|
存储 监控 安全
网络安全视角:从地域到账号的阿里云日志审计实践
网络安全视角:从地域到账号的阿里云日志审计实践
246 0
|
11月前
|
SQL 分布式计算 Serverless
基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
280 0
|
11月前
|
存储 弹性计算 运维
海量日志接入 Elasticsearch Serverless 应用降本70%以上
本文将探讨在日志场景下,使用阿里云Elasticsearch Serverless相较于基于ECS自建Elasticsearch集群的成本与性能优势,展示如何通过Serverless架构实现高达 70%以上的成本节约。
576 0
|
9月前
|
安全 Java Linux
Linux安装Elasticsearch详细教程
Linux安装Elasticsearch详细教程
1726 64
|
8月前
|
JSON 安全 数据可视化
Elasticsearch(es)在Windows系统上的安装与部署(含Kibana)
Kibana 是 Elastic Stack(原 ELK Stack)中的核心数据可视化工具,主要与 Elasticsearch 配合使用,提供强大的数据探索、分析和展示功能。elasticsearch安装在windows上一般是zip文件,解压到对应目录。文件,elasticsearch8.x以上版本是自动开启安全认证的。kibana安装在windows上一般是zip文件,解压到对应目录。elasticsearch的默认端口是9200,访问。默认用户是elastic,密码需要重置。
4240 0

热门文章

最新文章

相关产品

  • 检索分析服务 Elasticsearch版