带你读《Elastic Stack 实战手册》之34:——3.4.2.17.3.全文搜索/精确搜索(7)

本文涉及的产品
Elasticsearch Serverless通用抵扣包,测试体验金 200元
简介: 带你读《Elastic Stack 实战手册》之34:——3.4.2.17.3.全文搜索/精确搜索(7)


《Elastic Stack 实战手册》——三、产品能力——3.4.入门篇——3.4.2.Elasticsearch基础应用——3.4.2.17.Text analysis, settings 及 mappings——3.4.2.17.3.全文搜索/精确搜索(6) https://developer.aliyun.com/article/1229937


6、我们再使用 WITHIN 查询范围为 10 到 22 的文档,应该只返回文档 11


POST my-index-000001/_search
{
  "query": {
    "range": {
      "agerange": {
        "gte": 10,
        "lte": 22,
        "relation": "WITHIN"
      }
    }
  }
}
# 返回内容
{
  ......
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "my-index-000001",
        "_type" : "_doc",
        "_id" : "11",
        "_score" : 1.0,
        "_source" : {
          "agerange" : {
            "lte" : 21,
            "gte" : 10
          }
        }
      }
    ]
  }
}

7、最后使用 WITHIN 查询范围为 10 到 30 的文档,应该两个文档均返回。


POST my-index-000001/_search
{
  "query": {
"range": {
      "agerange": {
        "gte": 10,
        "lte": 30,
        "relation": "WITHIN"
      }
    }
  }
}
# 返回内容
{
  ......
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "my-index-000001",
        "_type" : "_doc",
        "_id" : "12",
        "_score" : 1.0,
        "_source" : {
          "agerange" : {
            "lte" : 30,
            "gte" : 20
          }
        }
      },
      {
        "_index" : "my-index-000001",
        "_type" : "_doc",
        "_id" : "11",
        "_score" : 1.0,
        "_source" : {
          "agerange" : {
            "lte" : 21,
            "gte" : 10
          }
        }
      }
    ]
  }
}

注意:range 查询 text 或者 keyword 需要打开 search.allow_expensive_queries 设置。

 

3.6 fuzzy

 

Fuzzy 查询即模糊查询,用于返回包含与搜索词相似的词的文档。

 

先来理解一下编辑距离(edit distance)的概念。编辑距离是将一个词项转换为另一个词项所需的一个字符的更改数。比如:

 

l 更改一个字符( box → fox )

l 删除一个字符( black → lack )

l 插入字符( sic → sick )

l 调换两个相邻字符( act → cat )

 

为了找到相似的词项,模糊查询在指定的编辑距离内创建一组所有可能的变体或扩展的搜索词项。然后查询返回每个展开的精确匹配。

 

使用方法:


GET term-query/_search
{
  "query": {
    "fuzzy": {
      "user.id": {
        "value": "ki"
      }
    }
  }
}

相关参数:

 

l fuzziness:允许匹配的最大编辑距离。可以是 0/1/2/AUTO

l max_expansions:创建的最大变体或者扩展词项数。默认为50。有效的控制这个参数可以降低性能损耗。

l prefix_length:在创建展开时保持不变的起始字符数。默认值为0。 注意,正常使用中大部分的字母拼写错误发生在词的结尾,而不是词的开始。 例如通过将 prefix_length 设置为 3 ,能够显著降低匹配的词项数量。

l transpositions:指示编辑是否包括两个相邻字符的换位(ab→ba)。默认值为true。

 

详细使用:

GET term-query/_search
{
  "query": {
    "fuzzy": {
      "user.id": {
        "value": "ki",
        "fuzziness": "AUTO",
        "max_expansions": 50,
        "prefix_length": 0,
        "transpositions": true,
        "rewrite": "constant_score"
      }
    }
  }
}

注意:range 查询 text 或者 keyword 需要打开 search.allow_expensive_queries 设置。

 


《Elastic Stack 实战手册》——三、产品能力——3.4.入门篇——3.4.2.Elasticsearch基础应用——3.4.2.17.Text analysis, settings 及 mappings——3.4.2.17.3.全文搜索/精确搜索(8) https://developer.aliyun.com/article/1229934

相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
相关文章
|
域名解析 监控 算法
阿里云拨测:主动探测Web应用质量,助力提升用户体验
阿里云拨测是一种针对互联网应用(Web页面、网络链路等)进行应用性能和用户体验监测的服务,无需嵌码即可为云上用户提供开箱即用的企业级主动拨测式应用监测解决方案。
8175 110
阿里云拨测:主动探测Web应用质量,助力提升用户体验
|
JSON 负载均衡 JavaScript
带你读《Elastic Stack 实战手册》之65:——3.5.19.1.Elasticsearch语言开发(Python)(上)
带你读《Elastic Stack 实战手册》之65:——3.5.19.1.Elasticsearch语言开发(Python)(上)
378 1
|
安全 Java Android开发
Android 与 iOS:探索两大操作系统的差异与优势
本文将深入探讨安卓和iOS这两大主流移动操作系统的差异与优势。我们将分别从用户界面、应用生态系统、开发者支持以及性能与安全方面进行比较,帮助读者更好地了解并选择适合自己的操作系统。
387 0
|
SQL 运维 安全
数字堡垒的守卫者:网络安全漏洞与加密技术的较量
【6月更文挑战第30天】在数字化时代的浪潮中,网络安全和信息安全成为维护社会稳定、保障个人隐私的关键因素。本文将深入探讨网络安全漏洞的类型及其成因,分析当前加密技术如何作为防线抵御网络攻击,并强调提升安全意识的重要性。通过具体案例分析,揭示在网络攻防战中,技术与人为因素如何共同作用,以及我们如何能够更好地保护自己的数字资产。
|
XML JavaScript 数据格式
VUE3(三十一)html单页面使用VUE3
之前一直在VUE3的框架中使用VUE3。 但是我们在做一个小页面的时候,没有必要独立创建一个VUE项目的时候,我们该如何使用VUE3呢? 下边我这边直接放出一个示例,复制粘贴就能用
623 0
|
存储 索引 Python
【Python学习】—Python基础语法(六)
【Python学习】—Python基础语法(六)
|
数据格式 Python
添加 常用校验方法,校验常见数据格式
添加 常用校验方法,校验常见数据格式
139 0
|
固态存储 架构师 开发工具
|
存储 机器学习/深度学习 自然语言处理
基于 Elasticsearch 向量检索的以文搜图
本实验通过简易快速的阿里云相关组件和开源模型部署,通过1小时的动手实操,搭建基于Elasticsearch向量检索的以文搜图的搜索服务原型。
2777 4
|
Linux 调度 容器
【Linux学习】进程概念
【Linux学习】进程概念
129 0