【Elastic Engineering】Elasticsearch:Elasticsearch 中索引映射的非规范化

本文涉及的产品
Elasticsearch Serverless通用抵扣包,测试体验金 200元
简介: Elasticsearch:Elasticsearch 中索引映射的非规范化

作者:刘晓国


在写这篇文章之前,我首先来讲一下 normlization (规范化)以及 denormalization (非规范化)两个概念的区别。


Normalization (规范化):规范化是数据库中用于减少表中数据冗余和数据不一致的方法。 这是将非冗余和一致性数据存储在设置的架构中的技术。 通过使用规范化,表的数量增加而不是减少。


Denormalization(非规范化): 非规范化也是数据库中使用的方法。 它用于添加冗余以快速执行查询。 它是一种将数据组合起来以快速执行查询的技术。 通过使用非规范化,减少了与规范化相反的表数量。

image.png

在很多的描述中, Elasticsearchimage.png被描述为:store (存储),analyze (分析)及 search(搜索)。也就是说 Elasticsearch 也是一个数据库。我们必须了解的一点是 Elasticsearch 它不是一个 RDMS,也即关系数据库。你不可以在搜索的时候 join 不同的索引。非规范化是不自然的,但是这是提高 Elasticsearch 应用程序效率的关键。在实际的使用中,尽早考虑数据映射将使你的应用运行数年。


为什么要使用非规范化?


如果你寻找 Elasticsearch 的定义,则可能会发现以下内容:


Elasticsearch 是基于 Apache Lucene 构建的分布式开源搜索和分析引擎


但是也有很多人是这么说的:


Elasticsearch 是为搜索优化的分布式 NoSQL 数据库


NoSQL 数据库带有其自己的规则。通常,它们针对特定用例进行了优化,并且设计为最适合特定需求。因此,当 Elastic 优化其 NoSql 数据库进行搜索时,重点是 SPEED。在分析经典关系数据库的性能时,我们都知道 JOIN 具有成本,并且可能非常繁重且非常缓慢。


最大限度地提高它们的最佳方法是…删除它们。


因此,在 Elasticsearch 中,索引不能与另一个索引 join。因此,如果需要数据,则必须将其包含在索引中。


作为开发人员,多年来,你一直在努力利用规范化的技术水平,从未在任何地方重复任何信息。 你应该为某些 DB Design 感到骄傲。

image.png


如何使你的数据结构非规范化?


在等效的 SQL 中,你的目标是将多个表收集到一个表中。为此,你将不得不扁平并重复很多次!但这是将 200 毫秒的响应时间转换为 5 毫秒的关键。 在 Elasticsearch 范例中优化数据并不意味着与在 PostgreSQL 中优化数据相同。


我们来看一个非常简单的博客数据库示例:

image.png

首先,我们会问自己要搜索什么?

我们想搜索帖子,因此我们的索引将放在帖子(而不是博客)上,并将针对我们的搜索用例跟踪有趣的数据。


然后,Elasticsearch 文档可能看起来像这样:

POST denormalized-blog-posts
{
  "id": "12345",
  "title": "Denormalization for elastic search",
  "post_content": "my long text content",
  "blog": {
    "id": 1,
    "title": " Elasticsearch is a powerful search engine",
    "slogan": "better, faster, bigger",
    "user": {
      "id": "1",
      "username": "John"
    }
  },
  "tags": [
    "elasticsearch",
    "bdd",
    "beginner"
  ]
}

在这里:


1.针对每个 blog, user 部分都会在每个帖子上重复

2.我们只对 tag 名称感兴趣。 因此,我们将它们平整为数组在我们的每个帖子上。


作为 Elasticsearch 中的新手,这可能会非常令人不安,但我们必须这么做,这样才能使得我们的搜索效率更高。


在  Elasticsearch 中,确实有一个叫做 join 的数据类型。它能解决一部分关系数据库中的 join 问题,详细阅读请参阅文章 “Elasticsearch:在 Elasticsearch 中的 join 数据类型父子关系


相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
相关文章
|
11月前
|
自然语言处理 大数据 应用服务中间件
大数据-172 Elasticsearch 索引操作 与 IK 分词器 自定义停用词 Nginx 服务
大数据-172 Elasticsearch 索引操作 与 IK 分词器 自定义停用词 Nginx 服务
218 5
|
11月前
|
存储 分布式计算 大数据
大数据-169 Elasticsearch 索引使用 与 架构概念 增删改查
大数据-169 Elasticsearch 索引使用 与 架构概念 增删改查
169 3
|
10月前
|
存储 缓存 监控
优化Elasticsearch 索引设计
优化Elasticsearch 索引设计
191 5
|
10月前
|
存储 JSON 关系型数据库
Elasticsearch 索引
【11月更文挑战第3天】
209 4
|
10月前
|
测试技术 API 开发工具
ElasticSearch7.6.x 模板及滚动索引创建及注意事项
ElasticSearch7.6.x 模板及滚动索引创建及注意事项
169 8
|
4月前
|
JSON 安全 数据可视化
Elasticsearch(es)在Windows系统上的安装与部署(含Kibana)
Kibana 是 Elastic Stack(原 ELK Stack)中的核心数据可视化工具,主要与 Elasticsearch 配合使用,提供强大的数据探索、分析和展示功能。elasticsearch安装在windows上一般是zip文件,解压到对应目录。文件,elasticsearch8.x以上版本是自动开启安全认证的。kibana安装在windows上一般是zip文件,解压到对应目录。elasticsearch的默认端口是9200,访问。默认用户是elastic,密码需要重置。
2065 0
|
5月前
|
安全 Java Linux
Linux安装Elasticsearch详细教程
Linux安装Elasticsearch详细教程
877 1
|
10月前
|
存储 安全 数据管理
如何在 Rocky Linux 8 上安装和配置 Elasticsearch
本文详细介绍了在 Rocky Linux 8 上安装和配置 Elasticsearch 的步骤,包括添加仓库、安装 Elasticsearch、配置文件修改、设置内存和文件描述符、启动和验证 Elasticsearch,以及常见问题的解决方法。通过这些步骤,你可以快速搭建起这个强大的分布式搜索和分析引擎。
403 5
|
NoSQL 关系型数据库 Redis
mall在linux环境下的部署(基于Docker容器),Docker安装mysql、redis、nginx、rabbitmq、elasticsearch、logstash、kibana、mongo
mall在linux环境下的部署(基于Docker容器),docker安装mysql、redis、nginx、rabbitmq、elasticsearch、logstash、kibana、mongodb、minio详细教程,拉取镜像、运行容器
mall在linux环境下的部署(基于Docker容器),Docker安装mysql、redis、nginx、rabbitmq、elasticsearch、logstash、kibana、mongo
|
11月前
|
存储 JSON Java
elasticsearch学习一:了解 ES,版本之间的对应。安装elasticsearch,kibana,head插件、elasticsearch-ik分词器。
这篇文章是关于Elasticsearch的学习指南,包括了解Elasticsearch、版本对应、安装运行Elasticsearch和Kibana、安装head插件和elasticsearch-ik分词器的步骤。
1074 0
elasticsearch学习一:了解 ES,版本之间的对应。安装elasticsearch,kibana,head插件、elasticsearch-ik分词器。

相关产品

  • 检索分析服务 Elasticsearch版