带你读《2022技术人的百宝黑皮书》——基于特征全埋点的精排ODL实践总结(1) https://developer.aliyun.com/article/1246868?groupCode=taobaotech
在20年底我们曾探索过模型的实时在线学习,由于当时对Porsche和AOP等流式训练平台和组件的了解还不充分,只是初步走通了ODL模型训练的链路,并未在线上取得收益。在21年通过调研发现AMC特征中心的特征全埋点功能和porsche开发团队打造PyPorsche可以极大的简化ODL链路中的实时特征采集和样本生成流程,所以决定对原数据链路进行改造,并基于新的数据链路进行精排模型的ODL训练。
本文将从流式样本生成和模型实时训练两大块介绍每平每屋轻应用ODL链路搭建的实践经验,其中涉及到的AMC特征中心、PyPorsche、AOP和xDeepCTR等平台框架的使用方法请参考对应的文档,不再赘述。
流式样本生成
数据流架构
在每平每屋频道中,流式样本生成环节主要涉及到了:
1. UT行为日志解析
2. 全埋点特征解析
3. ODL 训练样本生成
带你读《2022技术人的百宝黑皮书》——基于特征全埋点的精排ODL实践总结(3) https://developer.aliyun.com/article/1246866?groupCode=taobaotech