跨境电商多语言搜索最佳实践

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
推荐全链路深度定制开发平台,高级版 1个月
OpenSearch LLM智能问答版免费试用套餐,存储1GB首月+计算资源100CU
简介: 本文详细介绍智能开放搜索OpenSearch行业版在跨境电商领域的智能搜索应用。

典型业务场景

搜索是电商场景的核心流量入口,在跨境电商、国际电商场景下亦是如此。在跨境电商搜索场景中,涉及多语言、多场景复杂搜索条件,搜索处理尤为复杂。首先,需要识别不同搜索场景下的语言类型,确定目标商品池。然后,识别用户查询意图,针对不同语言类型进行关键词改写和商品召回。最后,预测召回商品的潜在点击率,根据用户特征千人千面的返回搜索结果。

上述跨境电商搜索业务能最大程度的满足多语言场景下的用户搜索需求,同时提升搜索引导的点击率、GMV,满足业务增长诉求。

搜索核心痛点

  • 需要多语言搜索算法模型,自研搜索缺少数据、经验积累。特别是在中文搜索时召回结果偏少,无结果率过高,用户体验不佳
  • 跨境场景下,多语言业务搜索配置困难,需要针对不同语言进行特殊处理
  • 无法实现千人千面的的个性化搜索
  • 搜索引导购买效果不佳,业务增长面临瓶颈

解决方案

开放搜索中文电商场景下的最佳实践已经过丰富的验证,可参考:电商行业搜索最佳实践

本文主要介绍在英文电商领域的解决方案

电商英文行业分词模型

英文自带空格切分,大部分场景下可以基于空格分词。但实际搜索中,用户输入关键词有时会漏掉空格,出现连写情况,不做正确分词会导致搜索无结果。

对于电商英文行业,OpenSearch汇集多个相关数据来源,利用亿万级数据训练了英文电商行业增强版分词模型,支持英文连写等场景下的小粒度切分,提升英文搜索召回率。

文本

通用版

行业增强版

partydress

partydress

party dress

harrypotter

harrypotter

harry potter

redchristmassocks

redchristmassocks

red christmas socks

redgirlwinterjacket

redgirlwinterjacket

red girl winter jacket

电商英文行业词权重模型

词权重在query改写和相关性算分阶段都起到重要作用,通用版的词权重模型没有覆盖英文商品描述,在产品词、品牌词、修饰词的权重上表现较差。

针对电商英文行业,OpenSearch基于英文电商行业数据、BERT模型训练深度词权重模型,精准预测每个词的权重,提高搜索召回率与相关性排序效果。

文本

通用版

行业增强版

party dress

party:高 dress:中

party:中 dress:高

yellow shoes

yellow:高 shoes:中

yellow:低 shoes:高

red girl winter jacket

red:高 girl:中 winter:中 jacket:中

red:低 girl:低 winter:低 jacket:高

电商英文行业向量召回模型

相比传统文本搜索需要通过分词、同义词、纠错、词权重改写等算法技术增强语义搜索效果,基于深度学习的语义向量召回模型具备更强大的表征能力,可以更好地处理用户查询词中的简写、别名、拼写错误等情况。

OpenSearch和阿里达摩院合作自研的向量召回技术,在业界知名榜单MS MARCO上夺冠。结合电商英文行业数据训练的向量召回模型在OpenSearch行业增强版对客户透出。

排名

队伍

eval

dev

1

Alibaba OpenSearch

0.450

0.463

2

Team 2

0.440

0.454

3

Team 3

0.436

0.452


query

yellow dresses

向量召回 TOP 1

Long-sleeve Yellow Dress

向量召回 TOP 2

Short-sleeve Orange Dress

向量召回 TOP 3

Orange/ Floral Print Cami Dress


query

blackk shoes

向量召回 TOP 1

Black Flats Mary Jane Shoes

向量召回 TOP 2

Lace Up Front Black Boots

向量召回 TOP 3

Black Chunky Sneakers

配置流程

开放搜索英文电商行业增强版支持基于模板一键式完成搜索全链路配置,更多使用方法请参考 接入流程

客户价值

某中英文跨境电商行业客户,通过约10个工作日完成POC接入后:

  1. 整体业务搜索加购率提升超过25%,UV-CTR提升超过8%,搜索引导GMV转化提升10%以上
  2. 长尾query无结果率降低80%
  3. 基于个性化排序模型,实现千人千面的搜索结果展示

填写问卷享开放搜索英文电商行业版首月半价试用:https://page.aliyun.com/form/act4137000/index.htm

如果你想与更多开发者们进行交流、了解最前沿的搜索与推荐技术,可以钉钉扫码加入社群

1652670057315-93b9b018-216c-465a-9b24-b38441215ae7.jpeg

相关实践学习
基于OpenSearch搭建高质量商品搜索服务
本场景主要介绍开放搜索(OpenSearch)打造独有的电商行业垂直解决方案,模板内置电商查询分析、排序表达式及行业算法能力,沉浸式体验更高性能和效果的智能搜索服务,助力企业在线业务智能增长。
目录
相关文章
|
人工智能 自然语言处理 搜索推荐
阿里云开放搜索重磅发布!云时代搜索业务的价值重构
【云栖大会】阿里云开放搜索重磅发布~
6896 0
阿里云开放搜索重磅发布!云时代搜索业务的价值重构
|
2月前
|
JavaScript 搜索推荐 前端开发
DevDocs具备**一站式搜索、多语言支持、离线访问等**特色功能。
DevDocs具备**一站式搜索、多语言支持、离线访问等**特色功能。
114 56
|
6月前
|
人工智能 自然语言处理 搜索推荐
解读阿里云搜索开发工作台如何快速搭建AI语义搜索及RAG链路
本文介绍阿里云搜索开发工作台如何通过内置数据处理、查询分析、排序、效果测评、大模型等服务,结合阿里云搜索引擎及开源引擎,灵活打造AI语义搜索及RAG链路。
19990 15
|
6月前
|
存储 搜索推荐 索引
低代码使用问题之在审批单搜索功能中,为什么要冗余数据到专门的搜索引擎
低代码使用问题之在审批单搜索功能中,为什么要冗余数据到专门的搜索引擎
|
6月前
|
人工智能 自然语言处理 搜索推荐
阿里云搜索开发工作台:快速搭建AI语义搜索与RAG链路的深度解析
阿里云搜索开发工作台凭借其丰富的组件化服务和强大的模型能力,为企业快速搭建AI语义搜索及RAG链路提供了有力支持。通过该平台,企业可以灵活调用各种服务,实现高效的数据处理、查询分析、索引构建和文本生成等操作,从而大幅提升信息获取与处理能力。随着AI技术的不断发展,阿里云搜索开发工作台将继续优化和完善其服务,为企业数字化转型和智能化升级注入更强动力。
196 0
|
机器学习/深度学习 搜索推荐 算法
搜索场景下的智能推荐演变之路:从基础到个性化
本篇详细介绍了搜索场景下智能推荐技术的演变历程,从基础的协同过滤算法到个性化推荐的深度学习实现。通过代码示例,读者可以了解不同阶段推荐算法的原理和实际应用,以及如何评估推荐效果。文章旨在帮助读者深入理解智能推荐的发展趋势,为构建更智能、个性化的推荐系统提供有益的指导。
2156 0
|
自然语言处理 搜索推荐 算法
阿里云OpenSearch重磅推出LLM问答式搜索产品,助力企业高效构建对话式搜索服务
OpenSearch推出LLM智能问答版,面向行业搜索场景,提供企业专属问答搜索服务,基于内置的LLM大模型提供问答能力,一站式快速搭建问答搜索系统。
12162 7
|
搜索推荐 UED 索引
闲鱼技术2022年度白皮书-服务端主题-电商搜索里都有啥?详解闲鱼搜索系统(下)
闲鱼技术2022年度白皮书-服务端主题-电商搜索里都有啥?详解闲鱼搜索系统
288 0
|
机器学习/深度学习 自然语言处理 达摩院
文娱行业搜索最佳实践
本文将详细介绍如何通过“开放搜索(OpenSearch)内容增强版“在文娱垂类场景的应用,提升用户搜索体验,带来更多的业务转化
647 0
下一篇
开通oss服务