【近战2】移动电商搜索个性化技术

简介:

【编者按】好的技术实战分享从来不因为时间的流失而褪色。2011年开始运营的阿里技术沙龙共积累35期,近100位深度实战培训资源(PPT+视频)让很多朋友大呼过瘾。接棒阿里技术沙龙,云栖社区特别挑选最具人气的12场深度实战分享组成【近战】的第一个系列。其中包含新浪微博、淘宝搜索、美团、美丽说、淘宝推荐、小米、支付宝、阿里云、淘宝无线在内,涵盖建模、个性化推荐、排序学习、系统优化、数据监控、流量优化、架构探索等多方面一线经验总结。

以下为【近战】第2篇,移动电商搜索个性化技术。



移动端搜索流量保持高速增长,移动搜索与桌面搜索互为补充,使得消费者的网购行为得以进一步普及化和深入化。本次演讲主要介绍淘宝搜索技术如何思考移动端 搜索带来的技术挑战,如何来结合移动端设备私有化,使用时间碎片化,输入模式的多样化,交互方式的便捷化等特点来优化移动端搜索,及个性化在移动搜索中的应用。


1

1是移动视角的基本结构图。

                           2

2是移动搜索产品形态。

个性化体系结构

个性化搜索面临的挑战有很多:

大数据,稀疏,长尾,噪音:

淘宝上海量的商品,针对个体而言,发生行为的商品有限, 稀疏度在百万分之一,甚至更低。

用户行为模式的挖掘和利用:

网购行为的复杂性,如何准确的描述用户的兴趣和特色,包括长短期兴趣等? People change over time

冷启动:

新用户,新商品。

多样性与精确性的两难困境:

Interestingness v. relevance Need Serendipity

用户界面与用户体验:

个性化体验的可解释性。

系统的挑战性

评估的挑战性

个性化搜索误区:

千人千面并非意味着,去追求单纯个体的个性化体验,个性化搜索是立足于提升整体用户的个性化体验;

Personalization  != customization

勿忘行为建模的基本假设——hypothesis 接受商品 à 接受他得所有属性;

过度个性化——搜索场景的个性化:“to personalize or not to personalize “,Explore & Exploitation

主观性 vs. 客观性——“data driven”,购物行为所表现的个性化特点 = 用户的物理个性化特征。

     3

3展示了个性化技术的魅力。

  4

4是鸟瞰个性化体系。

   5

5为个性化体系框图。Offline:离线模型训练数据收集,过滤, 聚合,特征ID化,利用batch-learning产出nearline环节,online环节所需要的模型。Near-line

构建于流式计算体系的实时日志解析,行为特征抽取,聚合,实时用户profile预测,实时人群-商品累积行为特征计算,离散化处理;更新在线排序计算依赖的实时字段,UPS中实时userprofile字段,引擎中的商品正排字段;构建基于mini-batch的在线学习模型,增强系统的适应新数据的能力和explore能力; 实时反作弊。Online:各个排序维度模型的在线预测;多个排序因素的在线融合;EE 策略。

个性化体系的移动元素:

查询意图——时间,地点,逛/搜;pull or push

  用户肖像——移动端特色数据;跨屏行为建模,实时肖像特征。

  P(满意|query,用户,商品)。

  实时个性化。

E&E

Query/User 意图识别

  6和图7Query/User 意图识别,

  6

 7



8

8Query 的隐含个性化需求。

个性化数据

 

  9

如图9,私有化/移动化/社交化,跨屏行为、实时用户肖像。

 图10

如图10,用户个性化体系的实时用户DNA。

 图11

图11是个性化体系的实时用户DNA,采用滑窗方式抽取训练样本,窗口内的行为中前面n-1个提取特征,最后一个当作目标。

个性化模型

 

 

  图12

如图12,浏览和交互模式:自上而下的串行模型。

个性化模型的问题定义:个性化模型目标是,

如何考虑移动场景下浏览和交互模式下产生的 bias ?串行浏览模式下: 有效点击量化模型 (UCM);有效pv量化模型 (UBM)。

有效曝光量化模型 (UBM):

参考: A User Browsing Model to Predict Search Engine Click Data from Past Observations, Georges E. Dupret,Benjamin Piwowarski, SIGIR’08

 

有效点击量化模型 (UCM):

参考: Modeling dwell time to predict click-level satisfaction,Youngho Kim, Ahmed Hassan, Ryen W. White , and Imed Zitouni, WSDM 2014

  图13

图13为UBM&UCM的结果分析。

 图14

图14为个性化模型图。

实时个性化

 图15

如图15,流量大,屏幕小,行为特点:碎片化,随时随地。

 图16

如图16,互联网机器学习需要“上线”,当把学到的模型投入产品,人的行为会受模型影响,数据分布也会发生变化。

 图17

图17为移动搜索的实时计算。

个性化的E&E

图18

如图18,    a)  设计有效的个性化探索维度 。  b)   explore & exploitation的控制比例。c) 根据业务目标制定合理reward和regret量化函数。

  图19

图19列出来未来的挑战,欢迎大家一起来讨论。

 

 分享者介绍:

徐盈辉:日本丰桥技术科学大学计算机科学博士,2005年加入理光日本中央研究所,从事跨媒体检索、图像识别以及自然语言方面的研究。2005年度日本自然语言学会年度最佳论文奖,在国际学士会议发表多篇论文,日美中公开专利近20项;2012年加入阿里,资深算法专家,主导并推动大淘宝平台的搜索体系升级, 与搜索技术团队的工程师一起建立起集offline-nearline-online三位一体的电商平台个性化搜索体系。

                                                                                                            

PDF下载地址


来源阿里技术沙龙 

同论坛其他议题分享地址

【近战】系列文章,跟踪tag标签即可得到。 

相关文章
|
搜索推荐 算法 知识图谱
搜索场景下的智能推荐演变之路
本文中,阿里巴巴高级算法专家王悦就为大家分享了搜索场景下的智能推荐演变之路。
|
3月前
|
运维 监控 搜索推荐
【电商搜索】现代工业级电商搜索技术-Ha3搜索引擎平台简介
【电商搜索】现代工业级电商搜索技术-Ha3搜索引擎平台简介
83 0
|
3月前
|
机器学习/深度学习 存储 自然语言处理
【电商搜索】现代工业级电商搜索技术-Facebook语义搜索技术QueSearch(上)
【电商搜索】现代工业级电商搜索技术-Facebook语义搜索技术QueSearch(上)
39 0
|
3月前
|
机器学习/深度学习 自然语言处理 搜索推荐
【电商搜索】现代工业级电商搜索技术-Facebook语义搜索技术QueSearch(下)
【电商搜索】现代工业级电商搜索技术-Facebook语义搜索技术QueSearch(下)
32 0
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
【电商搜索】现代工业级电商搜索技术-EMNLP2024-无监督的用户偏好学习
【电商搜索】现代工业级电商搜索技术-EMNLP2024-无监督的用户偏好学习
37 0
|
8月前
|
JSON 搜索推荐 数据挖掘
电商数据分析的利器:电商关键词搜索API接口(标题丨图片丨价格丨链接)
淘宝关键词搜索接口为电商领域的数据分析提供了丰富的数据源。通过有效利用这一接口,企业和研究人员可以更深入地洞察市场动态,优化营销策略,并提升用户体验。随着电商平台技术的不断进步,未来的API将更加智能和个性化,为电商行业带来更多的可能性。
|
机器学习/深度学习 搜索推荐 算法
搜索场景下的智能推荐演变之路:从基础到个性化
本篇详细介绍了搜索场景下智能推荐技术的演变历程,从基础的协同过滤算法到个性化推荐的深度学习实现。通过代码示例,读者可以了解不同阶段推荐算法的原理和实际应用,以及如何评估推荐效果。文章旨在帮助读者深入理解智能推荐的发展趋势,为构建更智能、个性化的推荐系统提供有益的指导。
2154 0
短视频app开发,如何加强搜索功能对用户的吸引力
短视频app开发,如何加强搜索功能对用户的吸引力
|
自然语言处理 分布式计算 搜索推荐
专题实战 | 如何快速构建高质量电商行业搜索?
本文详细介绍如何快速接入智能开放搜索(OpenSearch)电商行业增强版,助力企业实现高质量搜索效果,提升业务转化率及用户产品体验!
1826 1
|
自然语言处理 监控 搜索推荐
搜索运营有哪些玩法,你知道吗?
大部分产品的搜索都是技术同学在不断的优化迭代,很容易忽视可以直接触达业务侧的运营同学的作用和价值。那今天就和大家分享下运营同学在搜索上有哪些玩法?阿里云开放搜索作为一站式可视化搜索开发平台,产品/运营同学可以在控制台参与哪些优化动作呢?
1149 1
搜索运营有哪些玩法,你知道吗?

热门文章

最新文章