Elasticsearch:使用 function_score 中的weight和gauss衰减函数定制搜索结果的分数

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: Elasticsearch:使用 function_score 中的weight和gauss衰减函数定制搜索结果的分数

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站点击跳转浏览。


    今天有一个需求是按照先是未处理,已处理,处理中来进行排序,先显示未处理的事情,然后已处理和处理中的放在后面,并且是当检索框选择了截止时间之后,按照截止进行排序,并且之前的未处理和处理中的顺序不发生改变。

思路:

    这个其实先考虑未处理处理中和截止时间之间的排序关系。这个可以通过function_score 中的weight加强函数来进行排序,可以给未处理赋予最大的权重,截止时间次大,之后的未处理和处理中权重最小

截止时间那个排序可以通过function_score 中的衰减函数gass函数来进行排序,距离截止时间越远,得分越低。

这样的话就可以实现先按照未处理大的排序逻辑,之后按照截止时间进行排序

    这里衰减函数默认的话是按照当前时间为原点,然后进行衰减的


function_score支持的衰减函数有三种,分别是 linear、exp 和 gauss


linear、exp、gauss三种衰减函数的差别只在于衰减曲线的形状,在DSL的语法上的用法完全一样

  • linear : 线性函数是条直线,一旦直线与横轴0香蕉,所有其他值的评分都是0
  • exp : 指数函数是先剧烈衰减然后变缓
  • guass(最常用) : 高斯函数则是钟形的,他的衰减速率是先缓慢,然后变快,最后又放缓

衰减函数们 (linear、exp、gauss) 支持的参数

  • origin : 中心点,或是字段可能的最佳值,落在原点(origin)上的文档评分_score为满分1.0,支持数值、时间 以及
    “经纬度地理座标点”(最常用) 的字段
  • offset : 从 origin
    为中心,为他设置一个偏移量offset覆盖一个范围,在此范围内所有的评分_score也都是和origin一样满分1.0
  • scale : 衰减率,即是一个文档从origin下落时,_score改变的速度
  • decay : 从 origin 衰减到 scale 所得的评分_score,默认为0.5 (一般不需要改变,这个参数使用默认的就好了)

以上面的图为例

  • 所有曲线(linear、exp、gauss)的origin都是40,offset是5,因此范围在40-5 <= value <=
    40+5的文档的评分_score都是满分1.0
  • 而在此范围之外,评分会开始衰减,衰减率由scale值(此处是5)和decay值(此处是默认值0.5)决定,在origin +/-
    (offset + scale)处的评分是decay值,也就是在30、50的评分处是0.5分
  • 也就是说,在origin + offset + scale或是origin - offset -
    scale的点上,得到的分数仅有decay分


    这里衰减函数默认的话是按照当前时间为原点,然后进行衰减的,所以我们设置默认按照当前事件的前100天为原点,来开始得分衰减,并且是按照秒来进行衰减,这样的话就可以实现按照截止时间来进行排序

参考http://www.javashuo.com/article/p-syxxtytd-ka.html

https://www.cnblogs.com/yinjihuan/p/13570778.html这两篇打分博客


function_scroe其他辅助的参数


boost_mode : 决定 old_score 和 加强score 如何合併

  • multiply(默认) : new_score = old_score * 加强score
  • sum : new_score = old_score + 加强score
  • min : old_score 和 加强score 取较小值,new_score = min(old_score, 加强score)
  • max : old_score 和 加强score 取较大值,new_score = max(old_score, 加强score)
  • replace : 加强score直接替换掉old_score,new_score = 加强score

score_mode : 决定functions裡面的加强score们怎麽合併,会先合併加强score们成一个总加强score,再使用总加强score去和old_score做合併,换言之就是会先执行score_mode,再执行boost_mode

  • multiply (默认)
  • sum
  • avg
  • first : 使用首个函数(可以有filter,也可以没有)的结果作为最终结果
  • max
  • min


java代码如下:用的weightFactorFunction和gaussDecayFunction


GaussDecayFunctionBuilder dateGaussDecayFunctionBuilder=ScoreFunctionBuilders.gaussDecayFunction("截止时间",time , "100d", "0s").setWeight(10);
        FunctionScoreQueryBuilder.FilterFunctionBuilder[] filterFunctionBuilders = new FunctionScoreQueryBuilder.FilterFunctionBuilder[]{
                new FunctionScoreQueryBuilder.FilterFunctionBuilder(QueryBuilders.prefixQuery("未处理,), ScoreFunctionBuilders.weightFactorFunction(100)),
                new FunctionScoreQueryBuilder.FilterFunctionBuilder(QueryBuilders.prefixQuery(“处理中”), ScoreFunctionBuilders.weightFactorFunction(1)),
                new FunctionScoreQueryBuilder.FilterFunctionBuilder(QueryBuilders.prefixQuery(“已处理”), ScoreFunctionBuilders.weightFactorFunction(1)),
                new FunctionScoreQueryBuilder.FilterFunctionBuilder(dateGaussDecayFunctionBuilder)
        };
        FunctionScoreQueryBuilder functionScoreQueryBuilder = QueryBuilders.functionScoreQuery(filterFunctionBuilders).scoreMode(FiltersFunctionScoreQuery.ScoreMode.SUM);


ScoreMode采用累加的方式

官方文档https://www.elastic.co/guide/cn/elasticsearch/guide/current/decay-functions.html


结语

🔥一个人可以掌握知识,但只有与他人交流才能形成智慧。

🔥One person can acquire knowledge, but wisdom is formed only in the exchange with others.

🏆 我坚信人与人之间的差距是表面上是财富的差距,本质上是大脑中认知的差距,


我们下期再见。

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
1月前
|
存储 自然语言处理 BI
|
9天前
|
存储 缓存 固态存储
Elasticsearch高性能搜索
【11月更文挑战第1天】
27 6
|
8天前
|
API 索引
Elasticsearch实时搜索
【11月更文挑战第2天】
19 1
|
29天前
|
JavaScript
箭头函数与普通函数(function)的区别
箭头函数是ES6引入的新特性,与传统函数相比,它有更简洁的语法,且没有自己的this、arguments、super或new.target绑定,而是继承自外层作用域。箭头函数不适用于构造函数,不能使用new关键字调用。
|
1月前
|
人工智能
云端问道12期-构建基于Elasticsearch的企业级AI搜索应用陪跑班获奖名单公布啦!
云端问道12期-构建基于Elasticsearch的企业级AI搜索应用陪跑班获奖名单公布啦!
172 2
|
1月前
|
Web App开发 JavaScript Java
elasticsearch学习五:springboot整合 rest 操作elasticsearch的 实际案例操作,编写搜索的前后端,爬取京东数据到elasticsearch中。
这篇文章是关于如何使用Spring Boot整合Elasticsearch,并通过REST客户端操作Elasticsearch,实现一个简单的搜索前后端,以及如何爬取京东数据到Elasticsearch的案例教程。
174 0
elasticsearch学习五:springboot整合 rest 操作elasticsearch的 实际案例操作,编写搜索的前后端,爬取京东数据到elasticsearch中。
|
1月前
|
数据可视化 开发者 索引
详解Wireshark LUA插件函数:function p_myproto.dissector(buffer, pinfo, tree)
在 Wireshark 中,LUA 插件通过 `function p_myproto.dissector(buffer, pinfo, tree)` 扩展协议解析能力,解析自定义应用层协议。参数 `buffer` 是 `PacketBuffer` 类型,表示原始数据包内容;`pinfo` 是 `ProtoInfo` 类型,包含数据包元信息(如 IP 地址、协议类型等);`tree` 是
57 1
|
28天前
|
JavaScript
箭头函数与普通函数(function)的区别
箭头函数是ES6引入的新语法,相比传统函数表达式更简洁,且没有自己的this、arguments、super或new.target绑定,而是继承自外层作用域。这使得箭头函数在处理回调和闭包时更加灵活方便。
|
2月前
|
存储 缓存 自然语言处理
深度解析ElasticSearch:构建高效搜索与分析的基石
【9月更文挑战第8天】在数据爆炸的时代,如何快速、准确地从海量数据中检索出有价值的信息成为了企业面临的重要挑战。ElasticSearch,作为一款基于Lucene的开源分布式搜索和分析引擎,凭借其强大的实时搜索、分析和扩展能力,成为了众多企业的首选。本文将深入解析ElasticSearch的核心原理、架构设计及优化实践,帮助读者全面理解这一强大的工具。
176 7
|
1月前
|
C++ 容器
函数对象包装器function和bind机制
函数对象包装器function和bind机制
18 0

热门文章

最新文章

  • 1
    Error: Package awesomeProject contains more than one main function Consider using File kind instead
    60
  • 2
    深度探索 Elasticsearch 8.X:function_score 参数解读与实战案例分析
    150
  • 3
    【C++入门到精通】function包装器 | bind() 函数 C++11 [ C++入门 ]
    86
  • 4
    DataWorks操作报错合集之DataWorksUDF 报错:evaluate for user defined function xxx cannot be loaded from any resources,该怎么处理
    104
  • 5
    DataWorks产品使用合集之在 DataWorks 中,Function Studio 功能如何解决
    75
  • 6
    DataWorks产品使用合集之在 DataWorks 中的 ODPS UDF(User-Defined Function,用户自定义函数)中,支持不定长参数如何解决
    72
  • 7
    Serverless 应用引擎操作报错合集之在阿里函数计算中,函数执行超时,报错Function time out after如何解决
    62
  • 8
    Serverless 应用引擎操作报错合集之在阿里函数计算中,云函数怎么一直报错Function instance exited unexpectedly(code 1, message:operation not permitted) with start command 'php server.php '.如何解决
    145
  • 9
    Serverless 应用引擎操作报错合集之阿里函数计算中我打开sd时遇到错误,信息为"Function instance exited unexpectedly(code 1, message:operation not permitted) with start command ' '."如何解决
    297
  • 10
    Serverless 应用引擎操作报错合集之阿里函数计算中配置完fc,出现‘Function instance exited unexpectedly(code 1, message:operation not permitted) with start command 'npm run start '. 报错如何解决
    201