ES中如何对text字段进行精确匹配

在线体验各类最新模型,更有模型 免费Token 额度领取!
立即体验
简介: ES中如何对text字段进行精确匹配

项目场景:


在实际使用ES过程中,经常会遇到这样的问题:

既需要对一个字段进行全文检索,又要对该字段进行等值查询。

我们知道全文检索的字段类型需要设置为text,但是text字段类型又不支持term等值查询。那么怎么解决这个问题呢?

答案是通过fields进行多字段配置


fields说明


为了不同的目的以不同的方式索引相同的字段通常很有用。这就是fields多字段的目的。

例如,一个string 字段可以被映射为一个text类型用于全文搜索的keyword字段,以及一个keyword类型用于等值比较、排序或聚合的字段。


fields主要使用场景:


对一个字段配置多个类型的type以应对不同的查询场景

对一个字段配置多个分词规则以支持多种全文检索规则


官网说明

多字段Multi-fields允许为不同目的以多种方式索引相同的字符串值,例如一个字段用于搜索和一个多字段用于排序和聚合,或者由不同的分析器分析相同的字符串值。


同字段多type配置


1、创建索引,在mapping中通过fields关键字给city字段添加别名raw,类型为keyword,用来做精确匹配以及排序。

PUT my-index-000001
{
  "mappings": {
    "properties": {
      "city": {
        "type": "text",
        "fields": {
          "raw": { 
            "type":  "keyword"
          }
        }
      }
    }
  }
}


2、添加数据

PUT my-index-000001/_doc/1
{
  "city": "New York"
}
PUT my-index-000001/_doc/2
{
  "city": "York"
}


3、查询

通过city.raw使用city的别名raw进行排序

GET my-index-000001/_search
{
  "query": {
    "match": {
      "city": "york" 
    }
  },
  "sort": {
    "city.raw": "asc" 
  },
  "aggs": {
    "Cities": {
      "terms": {
        "field": "city.raw" 
      }
    }
  }
}


同字段多分词规则配置


有些场景,我们需要一个字段,满足多套分词规则的检索。


1、新建索引

字段text,默认采用standard analyzer分词器;

通过fields声明别名english,采用english分词器。

PUT my-index-000001
{
  "mappings": {
    "properties": {
      "text": { 
        "type": "text",
        "fields": {
          "english": { 
            "type":     "text",
            "analyzer": "english"
          }
        }
      }
    }
  }
}


2、添加测试数据

PUT my-index-000001/_doc/1
{ "text": "quick brown fox" } 
PUT my-index-000001/_doc/2
{ "text": "quick brown foxes" }


3、查询测试

说明:利用multi_match多字段匹配查询,实现一个字段多种分词规则检索。

GET my-index-000001/_search
{
“query”: {
“multi_match”: {
“query”: “quick brown foxes”,
“fields”: [
“text”,
“text.english”
],
“type”: “most_fields”
}
}
}


总结:


本文主要是介绍了ES中通过fields定义字段别名,实现对text字段进行精准匹配。

1、text字段用来做全文检索,keyword字段用来做等值匹配、排序和聚合运算。

2、怎么通过fields给字段定义别名

3、fields多字段的2种典型运用场景:


1个字段数据需要对应多个type类型

1个字段数据需要满足多种分词匹配规则

目录
相关文章
|
存储 Java 索引
Elastic实战:彻底解决spring-data-elasticsearch日期、时间类型数据读取报错问题
在使用spring-data-elasticsearch读取es中时间类型的数据时出现了日期转换报错,不少初学者会在这里困惑很久,所以今天我们专门来解读该问题的几种解决方案。
2962 0
Elastic实战:彻底解决spring-data-elasticsearch日期、时间类型数据读取报错问题
|
监控 网络安全 索引
Elasticsearch-通过Kibana查看索引数据
引言   当数据存储到Elasticsearch后,我们希望能方便的通过界面进行查询,有两个工具能够满足我们的需要,一个是Elasticsearch-head插件,另一个是Kibana,笔者认为两个工具各有千秋,大家可以自行体会,不过就安装步骤来说,Elasticsearch-head真心麻烦,本文主要介绍如何部署Kibana,并使用Kibana来查看Elasticsearch中的索引数据。
11295 1
|
人工智能 前端开发 搜索推荐
|
12月前
|
存储 缓存 自然语言处理
Elasticsearch 查询性能优化:从 3 秒到 300ms 的 6 个核心参数调优指南
本文分享某电商平台 Elasticsearch 性能调优实战,通过调整分片数、刷新间隔、缓存配置等 6 个核心参数,将商品搜索从 3 秒优化至 300 毫秒,显著提升查询性能与系统吞吐量。内容涵盖性能诊断、参数调优逻辑、实操方案及避坑指南,助力高频查询场景下的 ES 优化。
|
存储 自然语言处理 关系型数据库
Elasticsearch 查询时 term、match、match_phrase、match_phrase_prefix 的区别
【7月更文挑战第3天】Elasticsearch 查询时 term、match、match_phrase、match_phrase_prefix 的区别
|
测试技术 定位技术 API
万字长文:一文彻底搞懂Elasticsearch中Geo数据类型查询、聚合、排序
万字长文:一文彻底搞懂Elasticsearch中Geo数据类型查询、聚合、排序
96234 140
|
并行计算 算法 C++
《探索C++在3D重建中的算法与技术要点》
3D重建是计算机视觉的重要技术,广泛应用于多个行业。C++因其高效性和对底层硬件的良好控制,成为实现3D重建算法的首选语言。本文介绍了多视图立体视觉、立体匹配、点云处理与重建、网格重建与优化、纹理映射及CUDA加速等关键技术,详细阐述了各算法的原理和C++实现要点。
488 18

热门文章

最新文章