阿里云 Elasticsearch Severless 如何做到成本降低50%

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 阿里云 Elasticsearch Serverless 服务正式上线。全新产品形态,基于云原生 Serverless 技术,致力于为用户打造更低成本、弹性灵活、开放兼容、开箱即用的云上 Elasticsearch 使用体验。

本文根据 2023 云栖大会演讲实录整理而成,演讲信息如下:


演讲人:赵弘扬 | 阿里云高级产品专家

阿里云检索分析服务 Elasticsearch 版云上演进之路

2017年,阿里云与 Elastic 开启开源战略合作,正式发布阿里云检索分析服务 Elasticsearch 版 ,100%兼容开源 Elasticsearch,开箱即用,提供开放兼容的云上检索分析服务。

2019年,阿里云实现 Elastic Stack 云上全托管,是国内首个将整个生态组件在云上做全托管的产品服务商, 提供端到端的检索分析解决方案,助力开源用户快速上云,规模化支撑万核云上用户。

2021年,面向市场推出了基于 Elasticsearch 内核引擎优化的版本,阿里内核深度优化 ,自研读写分离、存算分离架构,助力企业降本增效,并持续将版本背后的内核改进推动到 Elasticsearch 社区。

2023年,阿里云 Elasticsearch Serverless 服务正式上线。全新产品形态,基于云原生 Serverless 技术,致力于为用户打造更低成本、弹性灵活、开放兼容、开箱即用的云上 Elasticsearch 使用体验。

开源 Elasticsearch 面临的业务挑战

2017年至今,我们服务了数万企业级客户,运维了几十万个集群,总结了开源自建用户面临的常见痛点问题。

  • 大促不断、游戏发版、蜂拥请求,突发读写流量,集群遇到资源瓶颈,在短时间内扩容困难
  • 业务低峰期大量资源冗余,又因为某个时刻流量突增,不得不按高峰流量做容量规划
  • 服务器资源成本高、研发、测试、生产预算低,又要稳定又要降本增效
  • 项目团队没有专属的运维支持,集群稳定性运维难、需要随着业务发展持续优化,开发也要有运维经验

阿里云检索分析服务 Elasticsearch Serverless 版正式发布

基于上述挑战,我们推出了阿里云 Elasticsearch Serverless 服务。阿里云 Elasticsearch Serverless 是围绕 Elasticsearch 打造的云原生 Serverless 服务化产品,实现真正业务负载与资源动态匹配,用户无需管理集群及资源配置,只需根据实际资源使用按需付费;提供弹性扩缩能力,在高峰期也能满足业务需求;ES 原生态用户可以平滑切换和使用 Serverless 版本,助力业务快速上云。

Elasticsearch Serverless 服务核心能力解读

秒级弹性伸缩

在 IDC 或者 ECS 上构建开源 Elasticsearch,需要提前规划集群规模,包括数据节点、协调节点和主节点数量以及每个节点需要配置的数据存储盘。另外在生产使用的过程中也需要基于业务流量的波动和变化调整集群规模,就会担心变更过程中集群的稳定性和安全性。

而阿里云 Elasticsearch Serverless 服务通过虚拟多租户的能力,将一个非常大的物理集群拆分成N个租户提供给用户,用户实际上拿到的是逻辑层面的单元,而非持有单个物理集群。当流量洪峰到来,资源消耗量高于设定的阈值时,就会为租户多分配一些已经存在的资源,不涉及到物理层面的扩容,灵活动态地调配给客户的资源上限和下限,实现真正意义上的弹性扩缩。另外逻辑层面单元中的扩容和缩容相对平滑,不会出现集群不稳定,业务抖动以及其他负面影响。

真正的按量付费

Elasticsearch 在使用的过程中有两部分的资源开销是规避不掉的,一部分是由 CPU 和 Memory 带来的计算资源;一部分是 Store 自带的存储资源。阿里云 Elasticsearch Serverless 服务打破传统按固定规格付费模式 、以 CU 为计算资源计费,1个CU性能约等于1 Core CPU(最大)2 GB Mem,按实际用量每小时出账,实现了真正意义上的按量付费。

对于 CPU、Mem 这些瞬时计算资源:按小时付费,将”流量的波动精确到每小时”,并且会计算一个小时周期内计算资源的平均值,进行计费,不用再担心毛刺、更不用担心预防毛刺导致的水位冗余。对于存储这样的持续占有性资源:也通过类似的手段,将“存储的波动精确到每小时”,并且会计算一个小时周期内存储资源的平均值,进行计费。虽然存储是持续性累计,但通过这样的方式,可以更灵活的使用云上 Elasticsearch 的存储,既不用担心买多了,也不用担心不够用。

举个例子,某用户有网站建站信息检索业务场景,白天有流量,晚上没有流量。

  • 对应业务流量,需自建ES 2核4GiB单节点实例才可完成任务,自建一天费用 = 9.6元(2核4 GiB规格: 0.407698/时)。
  • 而使用 Elasticsearch Serverless 服务一天总费用 = 计算资源费用+存储费用 = 1.2 × 8 × 0.3975 + 0.2 × 16 × 0.3975 +1 × 0.0021 × 24 = 5.1384 元

使用 Elasticsearch Serverless 服务成本节省高达50%,这还只是高峰期只有2CU的场景。真实生产环境里面,当并发 QPS 达到1000,需要的 RT 是100毫秒的时候,又需要冗余多少资源?使用阿里云 Elasticsearch Serverless 服务又能节约多少资源?

简单免运维

使用 Elasticsearch 的时候可能会面临一些复杂且不可避免的运维工作。资源准备阶段需要根据大量实际生产经验做容量规划和配置;研发部署阶段又有各种各样的环境,数以千计的参数需要配置;运维阶段还需要配置监控告警的大盘,遇到流量高峰需要盯盘,集群出现稳定性波动的时候还需要做集群恢复。

而阿里云 Elasticsearch Serverless 服务没有实体集群概念,不需要做任何形式或者种类的集群规划。基于智能化运维平台、读写分离和存算分离的引擎,基于阿里云最佳实践应用屏蔽了95%以上的运维成本,用户无需感知物理资源,1min即可快速创建。真正做到开箱即用,且无须人力干预资源水位及变配,大大提升了运维效率。

开放兼容

阿里云 Elasticsearch Serverless 服务支持 Elasticsearch 通用场景200+API、提供 Kibana、兼容各类开源组件,保留原有使用习惯,实现平滑迁移,助力业务快速上云。

Elasticsearch Serverless 服务技术架构

上图是 Elasticsearch Serverless 服务的技术架构图。最底下是存储层,这里写的是分布式存储,是多存储介质集联专门为搜索提供的存储服务,背后有 EBS 快存储、本地盘、高性能稳健存储和对象存储。在这个多级集联背后还有数据调度策略,什么样的数据查询密度高会放到本地盘里,什么样的数据查询密度低会放到对象存储里,在成本和性能中间博弈平衡,为用户带来性价比最高的面向搜索场景的存储体验。

再上一层是计算层,我们把 Elasticsearch 写数据的集群和查询索引的集群分开,就可以让资源在扩缩容的过程中更好、更精准地服务业务,也是实现真正意义上的按量付费和弹性扩缩的原因。

再往上一层是路由层,是 Elasticsearch Serverless 服务非常核心的环节,提供鉴权、路由、权控等相关能力。

最上面是和开源 API、开源组件以及客户业务场景相结合的应用层。

基于这样的四层架构, Elasticsearch Serverless 服务提供了免运维、弹性伸缩、低成本和开放兼容的产品能力。

Elasticsearch Serverless 服务未来演进方向

持续提升产品能力

提供更高弹性、更高可用、更易用的 Elasticsearch 云服务:

  • 高弹性

提高生产场景弹性上限;存储计算解耦;更高的弹性效率保证

  • 高可用性

自研引擎特性支撑 、提供企业级稳定性保障;安全加固 、强化数据安全保护

  • 易用性

场景化产品能力 、提供多场景最佳实践;提供更多开源兼容 、实现 Elastic Stack Serverless

持续提供解决方案

持续在多行业和场景为云上客户提供服务 :

我们希望拥抱各个垂直场景,围绕 Elasticsearch 生态,借助解决方案封装来服务更多的场景需求。在云上构建更多诸如多模态搜索、可观测、SIEM、数据库加速、ChatBot 问答交互等的解决方案。同时与各个场景的合作伙伴一起,打造中国搜索的应用级市场,借助阿里云的 PaaS 产品、技术的沉淀,以及云上客户和业务的积累,为中国市场提供更优质的产品、解决方案等诸多的服务能力。

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
算法 索引
阿里云 Elasticsearch 使用 RRF 混排优化语义查询结果对比
Elasticsearch 从8.8版本开始,新增 RRF,支持对多种不同方式召回的多个结果集进行综合再排序,返回最终的排序结果。之前 Elasticsearch 已经分别支持基于 BM25 的相关性排序和向量相似度的召回排序,通过 RRF 可以对这两者的结果进行综合排序,可以提升排序的准确性。
2225 0
|
弹性计算 运维 监控
阿里云 Elasticsearch Serverless 全新发布,平均可省50%成本
阿里云 Elasticsearch Serverless 全新发布,平均可省50%成本,致力于为用户打造更低成本、弹性灵活、开放兼容、开箱即用的云上 Elasticsearch 使用体验。
1230 0
|
1月前
|
存储 自然语言处理 BI
|
22天前
|
存储 人工智能 自然语言处理
Elasticsearch Inference API增加对阿里云AI的支持
本文将介绍如何在 Elasticsearch 中设置和使用阿里云的文本生成、重排序、稀疏向量和稠密向量服务,提升搜索相关性。
65 14
Elasticsearch Inference API增加对阿里云AI的支持
|
6月前
|
存储 数据可视化 数据建模
阿里云大佬叮嘱我务必要科普这个 Elasticsearch API
阿里云大佬叮嘱我务必要科普这个 Elasticsearch API
75 0
|
机器学习/深度学习 人工智能 自然语言处理
国内首家!阿里云 Elasticsearch 8.9 版本释放 AI 搜索新动能
阿里云作为国内首家上线 Elasticsearch 8.9版本的厂商,在提供 Elasticsearch Relevance Engine™ (ESRE™) 引擎的基础上,提供增强 AI 的最佳实践与 ES 本身的混合搜索能力,为用户带来了更多创新和探索的可能性。
1686 1
|
存储 运维 监控
深度解读阿里云 Elasticsearch Serverless 服务如何实现超高性价比
阿里云 Elasticsearch Serverless 商业化版本正式上线,在帮助用户快速构建数据检索与分析应用的同时,提供按实际资源用量付费的付费体验,与自建相比大幅降低成本,助力用户快速上云!
2774 0
深度解读阿里云 Elasticsearch Serverless 服务如何实现超高性价比
|
存储 机器学习/深度学习 SQL
阿里云 Elasticsearch简介和购买流程
开源Elasticsearch是一个基于Lucene的实时分布式的搜索与分析引擎,是遵从Apache开源条款的一款开源产品,是当前主流的企业级搜索引擎。作为一款基于RESTful API的分布式服务,Elasticsearch可以快速地、近乎于准实时地存储、查询和分析超大数据集,通常被用来作为构建复杂查询特性和需求强大应用的基础引擎或技术。
|
存储 数据可视化 数据挖掘
阿里云Elasticsearch-趣味体验-仪表板
简述如何利用阿里云Elasticsearch以及 使用Kibana制作仪表板
|
机器学习/深度学习 SQL 监控
阿里云Elasticsearch-趣味体验
简述什么是阿里云Elasticsearch以及 使用Kibana查询数据

相关产品

  • 检索分析服务 Elasticsearch版