打分排序:用非精准打分结合深度学习模型的精准打分

简介: 广告引擎在排序阶段需精准匹配用户,常采用深度学习模型。但为避免资源浪费,可在召回后增设粗排环节,利用LR、GBDT等轻量模型筛选候选广告至数十条,再进行精排,兼顾效率与效果,确保百毫秒内完成检索。

广告引擎除了在召回环节和搜索引擎不一样之外,在打分排序环节也有自己的特点。这主要是因为它们需要返回的结果数量不同。具体来说就是,在搜索引擎中,我们要返回 Top K 个结果,但是在展示广告业务中,广告引擎往往最后只会返回一条广告结果!因此,对于最后选出来的这一条广告,我们希望它和用户的匹配越精准越好。所以,在广告引擎中,我们会使用复杂的深度学习模型来打分排序。

但如果在召回阶段选出的候选广告数量很多,那全部使用开销很大的深度学习模型来进行打分的话,我们是很难将单次检索结果控制在 0.1 秒之内的。而且,如果召回的候选广告数量有几千条,广告引擎最终又只能选出一条,那这几千条的候选广告都使用深度学习模型进行计算,会造成大量的资源浪费。

为了解决这个问题,我们可以在召回和精准打分排序之间,加入一个非精准打分的环节,来更合理地使用资源。具体来说就是,我们可以基于简单的机器学习模型(如逻辑回归模型(LR)、梯度提升决策树(GBDT)、因子分解机(FM)等)配合少量的特征,来完成这个非精准打分环节,将候选广告的数量限制在几十个的量级。然后,我们再使用深度学习模型来进行精准打分,最后选出分数最高的一个广告进行投放。这样,我们就能大幅节省计算资源,提升检索效率了。

相关文章
|
4月前
|
JavaScript 前端开发 安全
Vue 3
Vue 3以组合式API、Proxy响应式系统和全面TypeScript支持,重构前端开发范式。性能优化与生态协同并进,兼顾易用性与工程化,引领Web开发迈向高效、可维护的新纪元。(238字)
733 139
|
2月前
|
编解码 算法 前端开发
java后端开发学习路线+避坑指南
java后端开发学习路线+避坑指南
|
2月前
|
数据采集 存储 机器学习/深度学习
搜索引擎的整体架构和工作过程
搜索引擎由爬虫、索引和检索三大系统构成:爬虫负责抓取网页并存储;索引系统对网页去重、分析并构建倒排索引;检索系统通过查询分析、相关性排序等技术,返回精准结果。全过程融合文本分析、机器学习与大规模计算,确保高效准确搜索。
|
10月前
|
人工智能 供应链 Cloud Native
中国AI编码工具崛起:技术突围、生态重构与开发者新范式
中国AI编码工具如通义灵码、百度Comate等,正从西方产品的主导中突围。通过大模型精调、中文友好型理解及云原生赋能,构建差异化优势。这些工具不仅提升效率,还推动中国软件产业从使用者向标准制定者转变。然而,技术原创性、生态碎片化和开发者信任危机仍是挑战。未来目标不是取代现有工具,而是定义适合中国开发者的智能编码新范式。
515 24
|
机器学习/深度学习 SQL 数据挖掘
ADB优化器背后的秘密:如何用成本估算和规则引擎编织高效的查询网络?
【8月更文挑战第27天】AnalyticDB (ADB) 是一款专为大规模数据集设计的高性能分析型数据库。本文深入探讨ADB的优化器如何通过成本估算、规则引擎及机器学习等策略生成高效执行计划。成本估算是选择最优路径的关键;规则引擎通过谓词下推等手段优化查询;机器学习则使优化器能基于历史数据预测执行效率。结合示例代码与执行计划分析,展现了ADB在提升查询性能方面的强大功能。未来,ADB将继续进化以满足日益增长的大数据分析需求。
310 0
|
云安全 运维 安全
网站安全挑战以及应对处理
随着云计算的发展,传统网站安全监管方式已无法适应云环境的需求。传统方式通过周期性安全扫描评估网站风险,但缺乏持续监测,无法及时发现突发性安全事件。德迅云安全提出云资产风险监测体系,针对当前四大安全挑战:全局风险态势不全、风险分析及响应能力不足、网络安全攻防不对等、网站合规运营能力缺失,提供全方位、多维度的监测解决方案,确保企业网络资产的安全。
拥抱不确定性:在技术世界中平衡创新与稳定性
【4月更文挑战第8天】 在快速迭代的技术领域,创新与稳定性之间的拉锯战不断上演。本文探讨了如何在追求前沿技术的同时维持系统的稳定性和可靠性。通过分析技术创新的风险与回报,提出一种平衡策略,旨在帮助技术决策者在不断变化的环境中找到合适的发展路径。
351 0
|
机器学习/深度学习 监控 Serverless
无服务器架构
无服务器架构
345 6
|
算法 编译器 C语言
【C语言】递归
【C语言】递归
283 0
|
负载均衡 Java Nacos
Spring Cloud 5大组件有哪些
Spring Cloud 5大组件有哪些
2958 0