[ElasticSearch]Term精确匹配中文字符串短语

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/SunnyYoona/article/details/51842221 1.
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/SunnyYoona/article/details/51842221

1. 给定数据

curl -XPUT 'localhost:9200/test-index/stu/1' -d'
{
    "name":"陈泽鹏",
    "sex":"boy",
    "college":"计算机学院"
}';
curl -XPUT 'localhost:9200/test-index/stu/2' -d'
{
    "name":"廖力生",
    "sex":"boy",
    "college":"通信学院"
}';
curl -XPUT 'localhost:9200/test-index/stu/3' -d'
{
    "name":"李源一",
    "sex":"girl",
    "college":"计算机学院"
}';
curl -XPUT 'localhost:9200/test-index/stu/4' -d'
{
    "name":"陈哲超",
    "sex":"girl",
    "college":"计算机学院"
}';
curl -XPUT 'localhost:9200/test-index/stu/5' -d'
{
    "name":"AA",
    "sex":"girl",
    "college":"计算机学院"
}';
curl -XPUT 'localhost:9200/test-index/stu/6' -d'
{
    "name":"bb",
    "sex":"girll",
    "college":"通信学院"
}';
curl -XPUT 'localhost:9200/test-index/stu/7' -d'
{
    "name":"方镜淇",
    "sex":"boy",
    "college":"电子工程学院"
}';
curl -XPUT 'localhost:9200/test-index/stu/8' -d'
{
    "name":"吴兴涵",
    "sex":"boy",
    "college":"计算机学院"
}';

2. 需求

我们想精确匹配出来自计算机学院的学生,所以我们就实现如下语句:

QueryBuilder queryBuilder = QueryBuilders.termQuery("college", "计算机学院");
// Search
SearchRequestBuilder searchRequestBuilder = client.prepareSearch(index);
searchRequestBuilder.setTypes(type);
searchRequestBuilder.setQuery(queryBuilder);
// 执行
SearchResponse searchResponse = searchRequestBuilder.execute().actionGet();

返回结果:

20:30:46.815 [main] INFO  com.sjf.open.api.TermLevelQuery - ----------termMatch size 0

表示没有找到来自计算机学院的同学,这咋可能。。。。

3. 解决方案

3.1 解决方案一 

把计算机学院拆分成多个汉字,再利用bool查询查找:

// Query
BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery();
boolQueryBuilder.must(QueryBuilders.termQuery("college", "计"));
boolQueryBuilder.must(QueryBuilders.termQuery("college", "算"));
boolQueryBuilder.must(QueryBuilders.termQuery("college", "机"));
boolQueryBuilder.must(QueryBuilders.termQuery("college", "学"));
boolQueryBuilder.must(QueryBuilders.termQuery("college", "院"));
// Search
SearchRequestBuilder searchRequestBuilder = client.prepareSearch(index);
searchRequestBuilder.setTypes(type);
searchRequestBuilder.setQuery(boolQueryBuilder);
// 执行
SearchResponse searchResponse = searchRequestBuilder.execute().actionGet();

返回结果:

20:34:53.022 [main] INFO  com.sjf.open.api.Search - ----------hit source: id 5 source {college=计算机学院, sex=girll, name=AA}
20:34:53.028 [main] INFO  com.sjf.open.api.Search - ----------hit source: id 8 source {college=计算机学院, sex=boy, name=吴兴涵}
20:34:53.029 [main] INFO  com.sjf.open.api.Search - ----------hit source: id 1 source {college=计算机学院, sex=boy, name=陈泽鹏}
20:34:53.029 [main] INFO  com.sjf.open.api.Search - ----------hit source: id 7 source {college=计算机学院, sex=boy, name=陈哲超}
20:34:53.029 [main] INFO  com.sjf.open.api.Search - ----------hit source: id 3 source {college=计算机学院, sex=girll, name=李源一}

3.2 解决方案二

设置字段属性,设置为not_analyzed,再插入上面数据:

curl -XPUT 'localhost:9200/test-index' -d'
{
    "mappings":{
        "stu":{
            "properties":{
                "name":{
                    "type":"string"
                },
                "sex":{
                    "type":"string"
                },
                "college":{
                    "type":"string",
                    "index":"not_analyzed"
                }
            }
        }
    }
}';

具体分析:https://www.elastic.co/guide/en/elasticsearch/reference/2.3/query-dsl-term-query.html

再次查询:

QueryBuilder queryBuilder = QueryBuilders.termQuery("college", "计算机学院");
// Search
SearchRequestBuilder searchRequestBuilder = client.prepareSearch(index);
searchRequestBuilder.setTypes(type);
searchRequestBuilder.setQuery(queryBuilder);
// 执行
SearchResponse searchResponse = searchRequestBuilder.execute().actionGet();

输出结果:

20:34:53.022 [main] INFO  com.sjf.open.api.Search - ----------hit source: id 5 source {college=计算机学院, sex=girll, name=AA}
20:34:53.028 [main] INFO  com.sjf.open.api.Search - ----------hit source: id 8 source {college=计算机学院, sex=boy, name=吴兴涵}
20:34:53.029 [main] INFO  com.sjf.open.api.Search - ----------hit source: id 1 source {college=计算机学院, sex=boy, name=陈泽鹏}
20:34:53.029 [main] INFO  com.sjf.open.api.Search - ----------hit source: id 7 source {college=计算机学院, sex=boy, name=陈哲超}
20:34:53.029 [main] INFO  com.sjf.open.api.Search - ----------hit source: id 3 source {college=计算机学院, sex=girll, name=李源一}


相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
目录
相关文章
|
4月前
|
存储 自然语言处理 关系型数据库
Elasticsearch 查询时 term、match、match_phrase、match_phrase_prefix 的区别
【7月更文挑战第3天】Elasticsearch 查询时 term、match、match_phrase、match_phrase_prefix 的区别
|
3月前
|
自然语言处理 Java
ElasticSearch 实现分词全文检索 - term、terms查询
ElasticSearch 实现分词全文检索 - term、terms查询
131 0
|
6月前
|
自然语言处理
elasticsearch中term与match区别
elasticsearch中term与match区别
81 0
|
存储 SQL 缓存
|
存储 SQL 缓存
四.全文检索ElasticSearch经典入门-字符串查询&批量查询&DSL查询过滤&乐观锁
四.全文检索ElasticSearch经典入门-字符串查询&批量查询&DSL查询过滤&乐观锁
|
存储 缓存 自然语言处理
Elasticsearch倒排索引(二)深入Term Index
Elasticsearch倒排索引(二)深入Term Index
442 0
白话Elasticsearch61-进阶篇之基于Term Vectors深入探查数据的情况
白话Elasticsearch61-进阶篇之基于Term Vectors深入探查数据的情况
88 0
|
分布式计算 自然语言处理 Java
白话Elasticsearch17-深度探秘搜索技术之match_phrase query 短语匹配搜索
白话Elasticsearch17-深度探秘搜索技术之match_phrase query 短语匹配搜索
115 0
|
分布式计算 Java Hadoop
白话Elasticsearch07- 深度探秘搜索技术之基于term+bool实现的multiword搜索底层剖析
白话Elasticsearch07- 深度探秘搜索技术之基于term+bool实现的multiword搜索底层剖析
80 0
|
Linux Docker 容器
Centos 7 下安装kibana,ik中文分词器以及ElasticSearch集群教程(二)
Centos 7 下安装kibana,ik中文分词器以及ElasticSearch集群教程
240 0
 Centos 7 下安装kibana,ik中文分词器以及ElasticSearch集群教程(二)