ElasticSearch Relation Design (ES关联查询)

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
云数据库 RDS MySQL Serverless,价值2615元额度,1个月
简介: ElasticSearch Relation Design (ES关联查询)

Parent Child (父子文档)

父子文档的结构目录,适用于频繁写入,查询较少的场景。

因为底层每次更新只会更新单独的子文档,不是走全量更新的形式,所以对写入较为友好。

维护Join关系需要耗费比较大的内存,所以查询会相对来说较慢。


Nested (嵌套)

适用于频繁查询,写入较少的场景。

object对象结构的升级版本,嵌套结构,可以解决我们在object结构中查询不准确的问题。

因为每一次写入都会需要更新单条文档下全量的数据,但是又因为保存了每个对象的关系以及他们之间的独立性所以有着相对parent child更高的查询性能。


Other (其他方案)

在某些场景下,可能上述的方案都不太适合现有的场景。

例如: 复杂的关联关系 或者 海量的关联数据量。

我们在思考这个问题之前得先明确我们当下所使用的这些存储组件的意义,也就是说为什么我们会用到这些组件?

比如我们的ElasticSearch,Mysql,Hbase 等等其他组件

随着我们的思考我们会发现,ElasticSearch其实最适合的场景是从海量数据中查询出找出自己想要的那部分数据。也就说其实它最强大的功能是搜索,而并不是特别大体量的数据召回能力,在这个基础上我们很容易就能设想出结合其他技术的解决方案。


方案的具体设计思路

ElasticSearch + Mysql

在有些场景下MySQL需要多表联查数据,但是好多字段都没有建立索引,单独为某一需求建立索引又不太现实,因为熟悉Mysql的同学也都知道,建立索引是需要额外维护B + Tree的,它会占用我们的内存空间,导致我们的IO速度变慢,这时候我们可以通过ES强大的搜索能力来帮助我们做多条件筛选,筛选出对应的Mysql表对应的业务主键Id,比如保险行业的业务id就是投保单号,我们可以根据投保单号去搜索Mysql,直接使用主键去定位数据,避免了多次回表以及没有建立索引产生的性能损耗,提高MySQL查询的性能。


ElasticSearch + Hbase

适用于单表查询或者一对多查询的场景下,配合kafka一起使用,从源库中做数据同步到ES以及Hbase,只存储主业务表的数据在ElasticSearch,也就是一对多关系当中的一,如果只需要召回这一部分数据的话ElasticSearch就可以直接返回,如果还需要查询多表数据的话,那么我们就会通过反转id作为rowkey去查询我们的Hbase然后获取到想要获取的多表数据,对返回值进行封装返回,此操作也可用于对接其他微服务系统,来为其他服务提供查询支持,类似于中台的架构设计。





相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
目录
相关文章
|
3月前
|
存储 固态存储 Java
Elasticsearch中查询性能优化
Elasticsearch中查询性能优化
198 0
|
21天前
Elasticsearch【问题记录 02】【不能以root运行es + max virtual memory areas vm.max_map_count [65530] is too low处理】
【4月更文挑战第12天】Elasticsearch【问题记录 02】【不能以root运行es + max virtual memory areas vm.max_map_count [65530] is too low处理】
21 3
|
5天前
|
存储 SQL 运维
Elasticsearch 查询革新:探索 Wildcard 类型的高效模糊匹配策略
Elasticsearch 查询革新:探索 Wildcard 类型的高效模糊匹配策略
20 0
|
5天前
|
运维 测试技术 数据处理
Elasticsearch 优化查询中获取字段内容的方式,性能提升5倍!
Elasticsearch 优化查询中获取字段内容的方式,性能提升5倍!
15 0
|
5天前
|
SQL 缓存 Linux
干货 | Elasticsearch 8.11 ES|QL 初体验
干货 | Elasticsearch 8.11 ES|QL 初体验
15 0
|
5天前
|
存储 缓存 Java
Elasticsearch 8.X 聚合查询下的精度问题及其解决方案
Elasticsearch 8.X 聚合查询下的精度问题及其解决方案
14 0
|
13天前
|
SQL JSON DataWorks
DataWorks产品使用合集之DataWorks 数据集成任务中,将数据同步到 Elasticsearch(ES)中,并指定 NESTED 字段中的 properties 类型如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
21 0
|
17天前
|
自然语言处理 Java 索引
SpringBoot 实现 elasticsearch 查询操作(RestHighLevelClient 的案例实战)
SpringBoot 实现 elasticsearch 查询操作(RestHighLevelClient 的案例实战)
20 1
|
3月前
|
缓存 算法 索引
【Elasticsearch专栏 07】深入探索:Elasticsearch的倒排索引如何进行模糊查询和通配符查询
Elasticsearch的倒排索引支持模糊查询和通配符查询,通过特定的算法和数据结构,能够实现对关键词的模糊匹配和通配符匹配。这两种查询类型提供了更灵活的搜索功能,但可能影响查询性能,需结合优化策略使用。
|
3月前
|
缓存 自然语言处理 数据挖掘
一篇文章让你学会Elasticsearch中的查询
一篇文章让你学会Elasticsearch中的查询
137335 118