电商/O2O行业搜索排序表达式最佳实践

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
OpenSearch LLM智能问答版免费试用套餐,存储1GB首月+计算资源100CU
简介: 搭建搜索功能不难,难的是如何提高搜索质量,帮助用户快速找到心中所想的内容或商品,那么搜索结果的相关性排序则是影响用户体验最关键的一环,今天小编和大家聊一聊[开放搜索]几个典型的排序表达式的应用,如何更好的优化电商/O2O行业的排序效果.

Query在开放搜索的执行流程

image.png

开放搜索排序表达式配置

image.png

场景1:关键词重复堆砌导致排序分数较高问题
案例:电商商家作弊问题:关键词重复堆砌导致排序分数较高,排序结果靠前
开放搜索解决方案:业务排序函数field_term_match_count,获取文档中某个字段与查询词匹配的词组个数,根据不同个数做不同的处理;
image.png

场景2:衡量商品时效性
开放搜索解决方案: 可以用在粗排和精排的timeliness函数,计算时效分,用于衡量文档/商品的新旧程度, 单位为秒,返回值:float,值域为[0,1],值越大表示时效性越好;

场景3:不同维度归为同一区间(综合分值)去排序
案例:一篇doc的好坏需要从不同的维度衡量。而各个维度的分数值域可能不同,网页点击数可能是成百上千万,网页的文本相关性分数在[0, 1]之间,它们之间没有可比性,为了在公式中使用这些元素,需要将不同的分数归一化至同一个值域区间,而normalize为这种归一化提供了一种简便的方法
开放搜索解决方案:归一化函数normalize根据不同的算分将数值归一化至[0, 1];

场景4: 对符合用户标签喜好的商品加权
案例: 年轻女用户搜索"鞋子",对应商品排序需求满足用户特性标签"年轻""女性";对符合用户标签喜好的商品加权,从而实现个性化搜索排序;
开放搜索解决方案: 商品可以具有多个属性标签,例如1表示年轻人(年龄)、2表示中年人(年龄)、3表示小清新(风格)、4表示时尚(风格)、5表示女性(性别)、6表示男性(性别)等等, 应用标签匹配tag_match 函数,实现对匹配到的商品做排序加权

场景5:某时间段的指定搜索需求
例如

  • 查询下午14点到15:30点营业的店铺
  • 查询下午14点到15:30之间,库存>10的店铺有哪些
  • 查询明天晚上能服务3-5个人的店铺

开放搜索解决方案: 运用功能函数bit_struct将INT_ARRAY字段值进行自定义分组并允许对分组值进行指定operation计算。

场景6:基于位置、距离搜索
案例:查找距离用户10公里内的【外婆家】餐厅,并按照距离由近及远排序
开放搜索解决方案:运用distance函数, 获取两个点之间的球面距离,一般用于LBS的距离计算。


以上就是阿里云开放搜索电商/O2O行业"排序表达式及特征函数”的应用案例,如果您对搜索与推荐相关技术感兴趣,欢迎加入钉钉群内交流~

image.png

【开放搜索】新用户活动:阿里云实名认证用户享1个月免费试用https://free.aliyun.com/product/opensearch-free-trial

目录
相关文章
|
XML 存储 API
RAG效果优化:高质量文档解析详解
本文介绍了如何通过高质量的文档解析提升RAG系统整体的效果。
16127 15
|
7月前
|
安全 大数据 虚拟化
随着云计算和大数据技术的发展,Hyper-V在虚拟化领域的地位日益凸显
随着云计算和大数据技术的发展,Hyper-V在虚拟化领域的地位日益凸显。作为Windows Server的核心组件,Hyper-V具备卓越的技术性能,支持高可用性、动态迁移等功能,确保虚拟机稳定高效运行。它与Windows深度集成,管理便捷,支持远程管理和自动化部署,降低管理成本。内置防火墙、RBAC等安全功能,提供全方位安全保障。作为内置组件,Hyper-V无需额外购买软件,降低成本。其广泛的生态系统支持和持续增长的市场需求,使其成为企业虚拟化解决方案的首选。
|
人工智能 自然语言处理 算法
电商行业智能搜索技术原理全解析
对于电商平台来说,智能搜索功能是至关重要的。本文剖析电商行业的搜索专属特点和业务需求,并介绍开放搜索提供的【电商行业模板】智能搜索能力,希望带给企业更多提升业务转化的思路和解决方案~
5096 1
电商行业智能搜索技术原理全解析
|
消息中间件 Prometheus 监控
如何提升Kafka的效率?
如何提升Kafka的效率?
275 62
|
搜索推荐 API 对象存储
10分钟学会构建端到端的图片搜索服务
本文介绍在没有向量数据的情况下,怎样通过OpenSearch-向量检索版快速从零搭建图像搜索服务。
83319 69
|
12月前
|
存储 缓存 监控
深入了解MySQL内存管理:如何查看MySQL使用的内存
深入了解MySQL内存管理:如何查看MySQL使用的内存
1173 1
|
SQL 运维 安全
【产品升级】Dataphin V4.2重大升级:上线敏捷版,打通数据资产管理和消费,开启数据价值放大新篇章
Dataphin 是阿里巴巴旗下的一个智能数据建设与治理平台,旨在帮助企业构建高效、可靠、安全的数据资产。在V4.2版本中,Dataphin敏捷版上线助力企业打造轻量版数据中台,打通数据资产管理和消费,陪伴企业迈入数据高价值应用新阶段。
2810 2
【产品升级】Dataphin V4.2重大升级:上线敏捷版,打通数据资产管理和消费,开启数据价值放大新篇章
|
人工智能 自然语言处理 搜索推荐
解读阿里云搜索开发工作台如何快速搭建AI语义搜索及RAG链路
本文介绍阿里云搜索开发工作台如何通过内置数据处理、查询分析、排序、效果测评、大模型等服务,结合阿里云搜索引擎及开源引擎,灵活打造AI语义搜索及RAG链路。
20349 15
|
存储 算法 C++
【C++ map结构 】std::map 和 std::unordered_map 在使用上的差异
【C++ map结构 】std::map 和 std::unordered_map 在使用上的差异
432 0
|
缓存 Java Apache
七大主流的HttpClient程序比较
七大主流的HttpClient程序比较