Elasticsearch Span Query跨度查询-阿里云开发者社区

Elasticsearch Span Query跨度查询

2017-12-05 2154

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

ES基于Lucene开发，因此也继承了Lucene的一些多样化的查询，比如本篇说的Span Query跨度查询，就是基于Lucene中的SpanTermQuery以及其他的Query封装出的DSL，接下来就看一下这些DSL都如何使用吧！

更多翻译参考：Elasticsearch知识汇总

span_term查询

这个查询如果单独使用，效果跟term查询差不多，但是一般还是用于其他的span查询的子查询。

用法也很简单，只需要指定查询的字段即可：

{
    "span_term" : { "user" : "kimchy" }
}

另外，还可以指定查询出的分值倍数：

{
    "span_term" : { "user" : { "value" : "kimchy", "boost" : 2.0 } }
}

span_multi查询

span_multi可以包装一个multi_term查询，比如wildcard,fuzzy,prefix,term,range或者regexp等等，把他们包装起来当做一个span查询。

用法也比较简单，内部嵌套一个普通的multi_term查询就行了：

{
    "span_multi":{
        "match":{
            "prefix" : { "user" :  { "value" : "ki" } }
        }
    }
}

也可以使用boost乘以分值，以改变查询结果的分数：

{
    "span_multi":{
        "match":{
            "prefix" : { "user" :  { "value" : "ki", "boost" : 1.08 } }
        }
    }
}

span_first查询

这个查询用于确定一个单词相对于起始位置的偏移位置，举个例子：

如果一个文档字段的内容是：“hello,my name is tom”，我们要检索tom，那么它的span_first最小应该是5，否则就查找不到。

使用的时候，只是比span_term多了一个end界定而已：

{
    "span_first" : {
        "match" : {
            "span_term" : { "user" : "kimchy" }
        },
        "end" : 3
    }
}

span_near查询

这个查询主要用于确定几个span_term之间的距离，通常用于检索某些相邻的单词，避免在全局跨字段检索而干扰最终的结果。

查询主要由两部分组成，一部分是嵌套的子span查询，另一部分就是他们之间的最大的跨度

{
    "span_near" : {
        "clauses" : [
            { "span_term" : { "field" : "value1" } },
            { "span_term" : { "field" : "value2" } },
            { "span_term" : { "field" : "value3" } }
        ],
        "slop" : 12,
        "in_order" : false,
        "collect_payloads" : false
    }
}

上面的例子中，value1，value2，value3最长的跨度不能超过12.

span_or查询

这个查询会嵌套一些子查询，子查询之间的逻辑关系为或

{
    "span_or" : {
        "clauses" : [
            { "span_term" : { "field" : "value1" } },
            { "span_term" : { "field" : "value2" } },
            { "span_term" : { "field" : "value3" } }
        ]
    }
}

span_not查询

这个查询相对于span_or来说，就是排除的意思。不过它内部有几个属性，include用于定义包含的span查询；exclude用于定义排除的span查询

{
    "span_not" : {
        "include" : {
            "span_term" : { "field1" : "hoya" }
        },
        "exclude" : {
            "span_near" : {
                "clauses" : [
                    { "span_term" : { "field1" : "la" } },
                    { "span_term" : { "field1" : "hoya" } }
                ],
                "slop" : 0,
                "in_order" : true
            }
        }
    }
}

span_containing查询

这个查询内部会有多个子查询，但是会设定某个子查询优先级更高，作用更大，通过关键字little和big来指定。

{
    "span_containing" : {
        "little" : {
            "span_term" : { "field1" : "foo" }
        },
        "big" : {
            "span_near" : {
                "clauses" : [
                    { "span_term" : { "field1" : "bar" } },
                    { "span_term" : { "field1" : "baz" } }
                ],
                "slop" : 5,
                "in_order" : true
            }
        }
    }
}

span_within查询

这个查询与span_containing查询作用差不多，不过span_containing是基于lucene中的SpanContainingQuery，而span_within则是基于SpanWithinQuery。

本文转自博客园xingoo的博客，原文链接：Elasticsearch Span Query跨度查询，如需转载请自行联系原博主。

Elasticsearch Span Query跨度查询

span_term查询

span_multi查询

span_first查询

span_near查询

span_or查询

span_not查询

span_containing查询

span_within查询

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Elasticsearch Span Query跨度查询

span_term查询

span_multi查询

span_first查询

span_near查询

span_or查询

span_not查询

span_containing查询

span_within查询

热门文章

最新文章

相关课程

相关电子书