在 Elasticsearch (ES) 中,布尔查询(Boolean Query)是一种查询类型,它允许你组合多个查询子句以控制搜索结果的匹配逻辑。minimum_should_match 是布尔查询中一个重要的参数,用于指定至少应该匹配的子句数量。
minimum_should_match 的值可以是一个具体的数字,也可以是一个百分比。它的具体含义取决于查询中的 should 子句的数量。
当 minimum_should_match 是一个整数时,它表示至少需要匹配的 should 子句数量。例如,如果将 minimum_should_match 设置为2,而查询中有4个 should 子句,那么至少需要匹配其中的2个子句才能满足查询条件。
当 minimum_should_match 是一个百分比时,它表示基于 should 子句的总数的相对比例。百分比的计算是根据有效的子句数量进行的,有效的子句是指那些非空、非布尔条件的子句。例如,如果设置 minimum_should_match 为"50%",而查询中有6个 should 子句,其中只有3个子句是非空的,那么至少需要匹配其中的2个子句(50% 的3)才能满足查询条件。
minimum_should_match 还可以使用特殊的语法来更精确地控制匹配条件。例如,可以使用百分比和固定值的组合,如"3<90%",表示至少需要匹配3个子句或总数的90%(以较大者为准)。
使用 minimum_should_match 参数可以灵活地控制布尔查询的匹配要求,使得查询结果更加符合预期。根据你的需求,可以根据子句的数量、百分比或它们的组合来调整该参数,以达到最佳的查询结果。
1、第一语义
minimum_should_match 参数用来指定 should 返回的文档必须匹配的条件的数量或百分比,如果 bool 查询包含至少一个 should 子句,而没有 must 或 filter 子句,则默认值为 1。
# 条件1: name中包含 "phone" # 当未设置 minimum_should_match 参数时,多个条件的关系为 OR # 条件2: type 等于 "phone" GET goods_en/_search { "_source": false, "query": { "bool": { "should": [ { "term": { "type.keyword": "phone" } }, { "match": { "name": "phone" } } ], "minimum_should_match": 2 // 设置为 2 则此时需要至少满足 2 个条件 } } }
2、第二语义
但是如果 bool 查询中同级子句中出现了 must 或者 filter 子句,则 minimum_should_match 的默认值将变为 0。
# ( must 或者 filter )和 should 组合 # 条件1: 价格小于20000 # 条件2: name中包含"phone"或者 type 等于"phone" GET goods_en/_search { "_source": false, "query": { "bool": { "filter": [ { "range": { "price": { "lte": "20000" } } } ], "should": [ { "term": { "type.keyword": "phone" } }, { "match": { "name": "phone" } } ], "minimum_should_match": 1 } } }