批批网在B2B电商领域的搜索业务探索之路

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
OpenSearch LLM智能问答版免费试用套餐,存储1GB首月+计算资源100CU
简介: B2B电商的搜索业务最佳实践案例分享

特邀嘉宾:丛锡兴--批批网CEO
视频地址:https://yunqi.aliyun.com/2020/session54?liveId=44653

批批网介绍:

批批网APP是一个基于传统批发市场、移动端的服装批发电商平台,率先将视频直播和服装B2B进行结合的电商平台,批批网从2015年发展到今天,已经成为服装批发领域的直播代言人。
*使命:用科技推动产业,让批发变得简单
愿景:成为国内卓越的在线批发平台
价值观:正直、激情、自省、团队、创新*
image.png

曲折的搜索之路:

尝试优化搜索功能,引入了搜索算法工程师,成立了专门的搜索项目组,使用开源搜索框架,再二次开发,但结果却没有达到要求,并且遇到很多问题:
1. 效果不理想:通过编写简易的规则,期望提升搜索体验,效果并不明显
2. 人才缺失:.如果想找到专业且合适的算法人才,实际是很难的事情
3. 数据缺乏时效性:难以平衡优质商品和新发布商品之间的权衡关系
4. 商家刷排名:部分商家找到排序漏洞,通过关键词堆砌,获得靠前位置,用户体验不好

搜索之路柳暗花明—阿里云开放搜索解决方案:

1.排序优化:
无需依赖开发工程师,也可以使用表达式实时调整排序结果
• 粗排,从命中的文档集合里海选出相关文档
• 精排,对粗排的结果做更精细筛选,支持任意复杂的表达式和语法。
• 相关性算分策略:取召回的rank_size(目前是100万)个文档按照粗排表达式的定义进行算分;取粗排分最高的N个结果(百级别)按照精排表达式进行算分,并排序;然后根据start与hit的设置取相应结果返回给用户。如果用户获取的结果超过了精排结果数N,则后续按照粗排分数排序结果继续展现。
image.png

2.聚合打散子句-distinct:
平衡“优质商品”和“新发布商品”的展示机会
• 打散子句可以在一定程度上保证展示结果的多样性,以提升用户体验。如一次查询可以查出很多的文档,但是如果某个用户的多个文档分值都比较高,则都排在了前面,导致一页中所展示的结果几乎都属于同一用户,这样既不利于结果展示也不利于用户体验。对此,打散子句可以对每个用户的文档进行抽取,使得每个用户都有展示文档的机会。

3.业务排序函数field_term_match_count
解决商家作弊问题: 关键词重复堆砌导致排序分数较高,排序结果靠前.
• 使用query_term_match_count,定义重复多少次为结果堆积。
• //这里以重复3次及其以上的为结果堆砌,if(field_term_match_count(title)>3,1,10)

image.png

4.查询语义理解:
预置好的搜索功能,即插即用,非常方便
image.png

搜索之路未来可期

未来批批网将会用上开放搜索(OpenSearch)更多高级的功能
• 人气模型—计算量化出每个商品的静态质量及受欢迎的程度的值,不断训练统计形成人气分,构建更精细化的排序模型,精准命中搜索需求
• 类目预测模型—根据用户的查询词来预测用户想要查询哪个类目的结果,结合排序表达式,可以使得更符合搜索意图的结果排序更靠前。
• A/B测试—便业务在全量使用前可以分配一定比例的流量进行先验,避免盲用带来对线上业务的负面影响


以上就是本次云栖大会--“批批网在B2B电商领域的搜索业务探索之路”的内容。如果您对搜索与推荐相关技术感兴趣,欢迎加入钉钉群内交流~

image.png

【开放搜索】新用户活动:阿里云实名认证用户享1个月免费试用https://free.aliyun.com/product/opensearch-free-trial

目录
相关文章
|
监控 安全 网络协议
2023年山东省职业院校技能大赛高职组信息安全管理与评估 模块一
2023年山东省职业院校技能大赛高职组信息安全管理与评估 模块一
|
供应链 数据建模 BI
打开阿里|阿里巴巴数字化的关键时刻
阿里巴巴如何跨越从信息化(IT)到数字化(DT)转型的关键时刻?
1988 0
打开阿里|阿里巴巴数字化的关键时刻
|
算法 数据挖掘 定位技术
采用 K-Means 聚类算法分析 GPS 轨迹
本文基于K-Means 聚类算法分析 GPS 轨迹,并给出数据集和详细代码
2201 0
采用 K-Means 聚类算法分析 GPS 轨迹
|
8月前
|
人工智能 自然语言处理 搜索推荐
高性价比| OpenSearch 智能问答版开箱即用 DeepSeek-R1
OpenSearch LLM智能问答版基于DeepSeek-R1一分钟搭建RAG系统。
1435 11
高性价比| OpenSearch 智能问答版开箱即用 DeepSeek-R1
|
10月前
|
SQL 前端开发 关系型数据库
阿里云百炼|析言GBI:产品博士的智能分析利器
本文介绍了阿里云“云知道”平台的云指针频道如何利用大模型实现从自然语言到SQL的转换,从而快速提供数据分析服务。通过阿里云AnalyticDB PostgreSQL版数据库存储数据,并结合析言GBI产品能力,实现了高效的数据查询与可视化展示。
1496 10
|
Java Apache Android开发
Java中的GUI界面设计与用户体验优化
Java中的GUI界面设计与用户体验优化
|
8月前
|
芯片
重芯云集· 锁定北京|2月28日“开放·连接”玄铁 RISC-V 生态大会就等你来!
2025年2月28日,“开放・连接”2025玄铁RISC-V生态大会将在北京望京凯悦酒店举办。作为中国RISC-V生态大会的同期活动,本次大会将展示玄铁及生态伙伴的最新成果,探讨未来发展。全球行业专家、技术领袖和RISC-V工程师将共聚一堂,分享合作进展与创新产品,见证玄铁软硬件全栈技术进程、“玄铁优选伙伴及芯片”颁奖、重磅合作项目发布等精彩内容。期待您的参与!
505 0
|
10月前
|
监控 供应链 数据可视化
基于用户生命周期的用户分层模型构建
本文探讨了用户分层模型在企业营销中的应用,包括一维、二维和三维分层模型的核心原理与应用方法,以及在银行、DTC营销和零售领域的实践案例。通过板栗看板等工具,企业可实现数据驱动的用户分层管理,优化运营策略,提升营销效率。
429 11
|
人工智能 自然语言处理 算法
电商行业智能搜索技术原理全解析
对于电商平台来说,智能搜索功能是至关重要的。本文剖析电商行业的搜索专属特点和业务需求,并介绍开放搜索提供的【电商行业模板】智能搜索能力,希望带给企业更多提升业务转化的思路和解决方案~
5096 1
电商行业智能搜索技术原理全解析
|
11月前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
1096 1