ES中如何实现like模糊查询

简介: ES中如何实现like模糊查询

问题描述:


我们都知道ES针对复杂的多添加组合查询非常强大,也知道通过match可以实现全文检索查询(分词查询),但是如果现在我只需要实现类似mysql中的like全匹配模糊查询,该怎么实现呢?


业务场景:


从content_index表中查询字段content中包含ES的记录。

在关系型数据库中对应的SQL语句:

SELECT 
    content
FROM  content_index
WHERE  content   like '%ES%'

数据准备:


## 删除索引
## DELETE content_index
## 新建索引
PUT content_index
{
  "mappings": {
    "properties": {
      "content": {
        "type": "wildcard"
      }
    }
  }
}
## 添加数据
POST content_index/_bulk?refresh
{ "create": { } }
{ "content": "老万最近正在学习ES"}
{ "create": { } }
{ "content": "老万精通JAVA"}
{ "create": { } }
{ "content": "ES从入门到放弃"}

72.png

说明:

ElasticSearch 5.0以后,String字段被拆分成两种新的数据类型: text用于全文搜索,会分词,而keyword用于关键词搜索,不进行分词。


补充:官网对wildcard字段类型的说明


说明:

1、采用wildcard通配符查询的字段推荐采用字段type设置为wildcard。

2、text字段会进行分词,wildcard通配符查询检索的是分词后的数据。

3、keyword字段虽然不会进行分词,但执行通配符wildcard查询(特别是带有前导通配符的模式)很慢。


实现方案:


1、sql实现

POST /_sql?format=txt
{
  "query": "SELECT content FROM content_index Where content like '%ES%'"
}

查询结果:


转为DSL查看底层实现:


POST /_sql/translate
{
  "query": "SELECT content FROM content_index Where content like '%ES%'"
}

执行结果:

底层就是基于wildcard的通配符查询,其中?和*分别代替一个和多个字符。

{
  "size" : 1000,
  "query" : {
    "wildcard" : {
      "content" : {
        "wildcard" : "*ES*",
        "boost" : 1.0
      }
    }
  },
  "_source" : false,
  "stored_fields" : "_none_",
  "docvalue_fields" : [
    {
      "field" : "content"
    }
  ],
  "sort" : [
    {
      "_doc" : {
        "order" : "asc"
      }
    }
  ]
}

2、dsl实现

利用wildcard通配符查询实现,其中?和*分别代替一个和多个字符。

GET content_index/_search
{
  "query": {
    "wildcard": {
      "content": {
        "value": "*ES*"
      }
    }
  }
}


查询结果:

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "content_index",
        "_type" : "_doc",
        "_id" : "E3E0BnsBxW9JEct2L-d4",
        "_score" : 1.0,
        "_source" : {
          "content" : "老万最近正在学习ES"
        }
      },
      {
        "_index" : "content_index",
        "_type" : "_doc",
        "_id" : "FXE0BnsBxW9JEct2L-d4",
        "_score" : 1.0,
        "_source" : {
          "content" : "ES从入门到放弃"
        }
      }
    ]
  }
}

总结


本文主要介绍了ES中通过wildcard通配符查询实现like模糊查询。

而sql查询的方式显然适合大众口味。

使用wildcard通配符查询的目标字段的type类型需要设置为wildcard。

目录
相关文章
|
前端开发 API
ES 高级实战(四)查询 ES 数据
ES 高级实战(四)查询 ES 数据
1380 0
ES 高级实战(四)查询 ES 数据
|
4月前
|
数据库
面试题ES问题之Elasticsearch的排序分页和高亮功能如何解决
面试题ES问题之Elasticsearch的排序分页和高亮功能如何解决
36 0
|
6月前
|
自然语言处理 索引
03_ES数据查询操作
03_ES数据查询操作
86 0
|
存储 SQL 缓存
|
存储 缓存 JSON
Redis实现分页+多条件模糊查询组合方案
Redis实现分页+多条件模糊查询组合方案
395 0
|
存储 缓存 JSON
Redis实现分页和多条件模糊查询方案
本文将基于Redis提供条件查询+分页的技术解决方案。
1710 0
Redis实现分页和多条件模糊查询方案
|
SQL JSON 自然语言处理
|
存储 自然语言处理
ES模糊查询失效问题
记录一下今天帮同事排查的一个问题
1027 0
|
JSON Java 数据格式
ES复杂查询-模糊查询
ES复杂查询-模糊查询