为解决目前用户长尾query召回少、搜索词填写错误无法召回、输入拼音无法召回等问题,增加查询分析功能,提升用户的搜索体验。
允许用户针对不同的索引字段制定不同的查询分析规则,一条查询分析规则包含一个或多个功能项。
可配置的分词类型
目前查询分析中可配置的分词,
只支持TEXT分词类别中的,中文基础分词 和 英文(去词根分词) 这2种,其它字段分词类型暂不支持。
流程演示
添加一个未上线规则:
选择该规则的功能:
修改适用范围(目前仅TEXT类型的索引字段可以配置该功能)。规则创建完毕后,可以通过查询中显式的指定qp=test1的方式进行搜索效果调试。调试无误后,可以“添加至上线”。
添加到已上线的规则会默认对所有查询语句起作用(系统会默认给查询拼上qp=test1,除非用户自己显式的拼接了qp参数)
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
针对您提到的需求,阿里云的开放搜索(OpenSearch)服务可以提供强大的查询分析和优化功能来解决用户长尾query召回率低、输入错误或拼音查询等问题。下面是如何利用阿里云OpenSearch实现这些需求的一些建议:
在阿里云OpenSearch中,可以通过自定义分析器或者选择预设的分析器来处理文本索引字段,以满足中文基础分词和英文去词根分词的需求。
ik_smart
或ik_max_word
等内置的IK分词器,它们适用于中文文本的分词,支持精准匹配和最大词数量匹配。english_stem
)来实现去词根的效果,或者直接使用适合英文的分词策略。虽然直接通过控制台配置每一条查询分析规则的功能项和适用范围的细节可能不如描述中那样直观,但可以通过以下方式间接实现:
多字段查询与权重调整:在OpenSearch中,可以通过调整查询DSL(Domain Specific Language)中的multi_match
查询或者使用function_score
来为不同字段设置不同的查询权重和分析策略,间接达到根据字段类型配置不同查询分析规则的目的。
自定义分析器:创建自定义分析器,针对特定字段应用特定的分词逻辑。这可以在索引创建时定义,或者对现有索引进行更新。
查询参数(qp):虽然直接通过qp参数指定测试规则的方式不是OpenSearch的标准操作,但你可以通过构造不同的查询字符串或使用OpenSearch提供的API来模拟不同场景下的查询效果,进行调试。
上线前测试:在OpenSearch中,可以先在一个非生产环境或者索引的副本上进行所有配置和规则的测试,确保效果满意后再应用到生产环境中。
动态更新:OpenSearch支持动态更新某些配置,比如映射和分析器设置,无需重建整个索引即可使新规则生效。
AB测试:如果需要更精细地控制新规则的上线影响,可以通过实施AB测试策略,即同时运行旧规则和新规则,并比较两者的性能和用户体验,逐步推广新规则。
综上所述,虽然直接通过界面配置每条查询分析规则并即时生效的机制可能不在OpenSearch的标准功能范围内,但通过灵活运用其提供的分析器定制、查询DSL以及索引管理功能,完全可以构建出满足您需求的高级查询分析系统,提升用户的搜索体验。