搜索引擎找到查询数据后,会对查询到的文档进行排序,并按照排序后的顺序返回给用户,用户可以采用翻页的方式来进行数据展示。
目前OpenSearch支持sort多维排序,sort子句中有个特殊的排序因子-RANK,即为相关性排序。目前系统提供的相关性开放了两轮的排序规则:
基础排序函数和
业务排序函数。
基础排序(粗排)即是海选,将符合条件的文档进行基础排序表达式计算得分,然后选取TOP N再进行业务排序(精排)表达式计算,最终按照业务排序得分排序后返回结果。从上面的处理逻辑来看,基础排序因为涉及文档多,所以需要尽量简单(匹配的文档越多对于基础排序表达式要求越高,否则会有好的文档进不了业务排序,无法展示的情况出现),将质量高的文档挑选出来即可,然后再根据业务排序来详细算分,做排序。
排序表达式允许用户为应用自定义搜索结果排序方式,通过在查询请求中指定表达式来对结果排序。排序表达式支持基本运算(算术运算、关系运算、逻辑运算、位运算、条件运算)、数学函数和文本相关性、时效性、tag_match、lbs等常用的搜索排序特征等。OpenSearch对于几种经典的应用(如论坛、资讯等)提供了表达式模板,用户可根据自己数据的特点,选择合适的表达式模板,并以此为基础进行修改,生成自己的表达式。