精选案例 | “虫虫音乐”如何做到搜索CTR提高150%

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
OpenSearch LLM智能问答版免费试用套餐,存储1GB首月+计算资源100CU
简介: 简介: 本文通过【虫虫音乐】在阿里云开放搜索的最佳实践,和大家介绍影音行业如何快速实现高质量的搜索服务助力业务更好发展!

公司背景

虫虫音乐是一家版权乐谱分发平台,致力于专业打造音乐教育和乐谱版权登记发行,拥有强大的年轻用户群体,为不同的音乐爱好者提供学习和出售作品的平台,提供了上传乐谱、版权登记、发行出售等服务。
image.png

  

搜索业务背景

客户痛点:

  • 当前搜索服务依赖于传统数据库,存在模糊查询不够灵活,性能一般问题,导致搜索召回效果不好,搜索成功率<70%, 用户体验欠佳;
  • 搜索效果的优化,需要专业的算法工程师,自行实现开发成本较高;
  • 重点面向专业的音乐人士,搜索流量占站内流量较高比重,打造高质量的搜索效果对业务至关重要;

客户需求:

  • 乐谱搜索的形式较为多样,用户可以通过"曲谱名称","歌手名称",“作者”,“调性”,"难易度"等多维度从乐谱库中进行复合搜索,例如: 后来 完整指法 C调 刘若英 初学者优先;
  • 提供query改写功能,如拼写纠错、同义词等;
  • 可对召回的结果更细粒度的打分,并以文档得分对召回结果排序展示;
  • 提高搜索召回点击率,提升业务转化能力;

开放搜索解决方案:

搜索服务架构图:
image.png

搜索能力解析
1. 查询语义理解:
• 开放搜索具备通用行业分词能力,预设好的query改写功能配置简单易上手,无需开发,使用方便,可快速响应搜索优化需求;
image.png

• 自定义词权重干预词典,满足同一字段多个分词参与召回的权重高低不同的业务需求,提高用户搜索成功率;
例如:同一query中曲谱的名字:“后来”,曲谱的调性:“C调”,曲谱的作者:“刘若英”,可以自定义干预分词的term的权重;
image.png

2. 排序优化
无需依赖开发工程师,也可以使用表达式实时调整排序结果;
• 基础排序(粗排):即是海选,从检索结果中快速找到质量高的文档,取出TOP N个结果再按照精排进行精细算分,基础排序对性能影响比较大;
• 业务排序(精排):对最终排序效果影响比较大,对粗排的结果做更精细筛选,支持任意复杂的表达式和语法;
• 相关函数应用
static_bm25:静态文本相关性,用于衡量query与文档的匹配度
normalize :归一化函数,根据不同的算分将数值归一化至[0, 1]
first_phase_score : 获取粗排表达式最终计算分值

3. 搜索引导功能:
对业务目标转化起到很好的铺垫作用;   
下拉提示:搜索中引导功能,在用户输入查询词的过程中,基于用户文档内容的query智能抽取,智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。
image.png

热词:搜索前引导功能,热词处于搜索引擎整个工作流程的最上游,越上游的环节,对于达成业务目标有着越重要的决定作用,结合运营策略对提升业务目标可以有比较大的发挥空间.
image.png

热词模型配置流程:内置成熟高级算法功能,无需自行编写定制;
image.png

客户心声

使用开放搜索后,不仅满足了业务的搜索需求,还提升了用户体验,从而实现业务目标的快速转化;

  • 相比之前,搜索成功率从70%提高到了97%,精准命中用户需求;
  • CTR增长超过150%;
  • 从数据库迁移到OpenSearch后,搜索速度得到了1倍以上的提升;
  • 大大提升了数据库的性能,减轻了数据库压力;
  • 团队无需再配置工程架构类开发和系统运维,降低了人力成本,省心省力;

以上就是影音行业“虫虫音乐”在阿里云开放搜索上的应用实践,如果您对搜索与推荐相关技术感兴趣,欢迎加入钉钉群内交流~

image.png

【开放搜索】新用户活动:阿里云实名认证用户享1个月免费试用https://free.aliyun.com/product/opensearch-free-trial

目录
相关文章
|
SQL HIVE
【hive】字符串操作,截取想要的字符串
字符串操作,截取想要的字符串
2064 0
【hive】字符串操作,截取想要的字符串
|
12月前
|
物联网 数据处理 持续交付
Docker适合哪些场景
【10月更文挑战第18天】Docker适合哪些场景
|
11月前
|
人工智能 自然语言处理 监控
函数计算玩转 AI 大模型
本文总结了对一个基于函数计算和AI大模型的解决方案的理解和实践体验。整体而言,方案描述详细、逻辑清晰,易于理解。但在技术细节和部署引导方面还有提升空间,如增加示例代码和常见错误解决方案。函数计算的优势在部署过程中得到了有效体现,特别是在弹性扩展和按需计费方面。然而,针对高并发场景的优化建议仍需进一步补充。总体评价认为,该解决方案框架良好,但需在文档和细节方面继续优化。
|
存储 数据处理 数据库
理解在服务架构中的事件驱动
【6月更文挑战第14天】网络架构和软件设计常基于ISO七层模型和三层应用架构,强调数据处理的重要性。事件驱动架构(EDA)以事件为中心,改变传统设计方式,解决系统问题。事件是触发通知或状态变化的操作,如用户下单。EDA适用于微服务通信、工作流程自动化、SaaS集成和基础设施自动化等场景,提高系统敏捷性和可扩展性。然而,EDA并非万能,需根据需求选择合适的设计方案。
304 1
理解在服务架构中的事件驱动
|
运维 关系型数据库 分布式数据库
在数据库应用中遇到的问题及阿里云数据库解决方案
企业在面临数据库性能瓶颈、可扩展性问题、高可用性不足及运维复杂等挑战时,选择了阿里云数据库解决方案。阿里云RDS和PolarDB通过读写分离、自动化索引优化、多副本架构等提升性能和扩展性;多可用区部署、数据复制等增强高可用性和容灾能力;自动化运维工具简化管理,降低运维成本。实施后,性能大幅提升,可扩展性增强,高可用性提升,运维工作简化,为业务稳定和未来发展奠定基础。
627 0
|
存储 算法
m考虑时偏影响的根升余弦滤波器matlab仿真
MATLAB 2022a仿真实现了根升余弦滤波器(RRC)的效果,该滤波器常用于通信系统以消除码间干扰。RRC滤波器设计考虑了时偏影响,其脉冲响应由理想矩形脉冲卷积得到,滚降系数控制衰减速度。在有同步误差时,滤波器需保持良好ISI抑制能力。MATLAB代码展示了计算时偏量并应用RRC滤波于连续样本的过程,以降低误码率并优化系统性能。
210 2
|
消息中间件 Prometheus 监控
RabbitMQ性能调优指南
【8月更文第28天】RabbitMQ 是一个非常流行的消息队列中间件,它支持多种消息协议,并且可以轻松集成到各种系统中。随着应用的扩展,确保 RabbitMQ 在高负载环境下能够高效稳定地运行变得至关重要。本文将深入探讨如何通过配置、监控以及最佳实践来优化 RabbitMQ 的性能。
1992 1
|
缓存 网络协议 数据挖掘
如何使用弱网环境来验证游戏中的一些延迟问题
如何使用弱网环境来验证游戏中的一些延迟问题
|
存储 算法 关系型数据库
【MySQL】default-storage-engine=MyIsam,是干什么的?底层原理是什么?
【MySQL】default-storage-engine=MyIsam,是干什么的?底层原理是什么?
958 0
|
存储 搜索推荐 Java
ElasticSearch第一讲:ElasticSearch从入门到精通(上)
ElasticSearch第一讲:ElasticSearch从入门到精通
1313 0