lucene 文档评分 及 CustomScoreQuery

简介: 1.评分 评分公式可见《lucence 文档评分公式》 2.解释 org.apache.lucene.search.Explanation 类,用于解释评分细节。 String org.apache.lucene.search.Explanation.toString() 文本格式输出。 String org.apache.lucene.search.Explanation.

1.评分

评分公式可见《lucence 文档评分公式》

2.解释

org.apache.lucene.search.Explanation
类,用于解释评分细节。
String org.apache.lucene.search.Explanation.toString()
文本格式输出。
String org.apache.lucene.search.Explanation.toHtml()
html格式输出。例子见图2-1.

图2-1 toHtml()格式的explanation

Explanation org.apache.lucene.search.IndexSearcher. explain(Query query, int doc)

给出doc对于query的评分。这个操作代价比较昂贵,等同于在整个索引上执行这个query。

3.自定义评分

场景:对最近修改过的文档进行加权。

3.1相关类

org.apache.lucene.queries. CustomScoreQuery
定制化评分的Query。
CustomScoreProvider org.apache.lucene.queries.CustomScoreQuery. getCustomScoreProvider(LeafReaderContext context)
拿到含有评分逻辑的CustomScoreProvider。
org.apache.lucene.queries. CustomScoreProvider
含有定制化评分逻辑的类。
float org.apache.lucene.queries.CustomScoreProvider. customScore(int doc, float subQueryScore, float valSrcScore)
一般会重写该方法。若认为这篇doc重要,可以return subQueryScore*加权程度。subQueryScore代表的是已有的评分,在此基础上进行干预更合理。


目录
相关文章
|
6月前
|
自然语言处理 搜索推荐 算法
基于Lucene的搜索引擎的设计与实现
基于Lucene的搜索引擎的设计与实现
52 0
|
存储 算法 API
Elasticsearch评分相关度算法解析
Elasticsearch评分相关度算法解析
146 0
|
搜索推荐 中间件 Linux
一个基于EntityFrameworkCore+Lucene实现的全文搜索引擎库
这是一个仅70KB的、轻量级的全文检索搜索引擎、基于Lucene实现的。
159 0
一个基于EntityFrameworkCore+Lucene实现的全文搜索引擎库
|
机器学习/深度学习 搜索推荐 数据处理
这就是搜索引擎读书笔记-day3-5.检索模型与搜索排序
搜索结果排序融合了上百种排序因子,而重要两因素是:用户查询和网页内容相关性 及 网页链接情况。本节介绍内容相关性介绍网页排序
这就是搜索引擎读书笔记-day3-5.检索模型与搜索排序
|
Java API Apache
lucene 相关性参考
假期梳理了之前在新浪博客的文档,将一些有用的内容搬到这里。本文是lucene序列原理分享之一:相关性原理。
73 0
|
自然语言处理 算法 索引
下一篇
无影云桌面