阿里妈妈首提AIGB并实现大规模商业化落地,将在NeurIPS 2024正式开源Benchmark

简介: 阿里妈妈提出AI-Generated Bidding(AIGB)新范式及DiffBid生成式竞价模型,突破传统基于强化学习的自动竞价方法局限。AIGB将自动竞价视为生成问题,通过捕捉复杂依赖关系,提升长期规划和随机环境中的稳定性和效果。DiffBid基于条件扩散建模,灵活生成满足特定目标的竞价轨迹,显著提升GMV和ROI。实验结果表明,DiffBid实现了2.81%的GMV增长和3.36%的ROI增长。然而,生成式建模的复杂性也带来了训练和调优的挑战。论文链接:https://arxiv.org/abs/2405.16141

在数字广告领域,自动竞价(Auto-bidding)技术正成为提升广告效果和效率的关键。然而,传统的基于强化学习(RL)的自动竞价方法,由于依赖于马尔可夫决策过程(MDP)的假设,在处理长期规划和高度随机的在线广告环境时,往往面临稳定性和效果的挑战。

为了解决这些问题,阿里妈妈提出了一种全新的自动竞价范式——AI-Generated Bidding(AIGB),并在其基础上开发了一种名为DiffBid的生成式竞价模型。这一创新性的方法,通过生成式建模而非传统的决策过程建模,为自动竞价带来了新的思路和突破。

AIGB范式的核心在于,它不再将自动竞价视为一个决策过程,而是将其视为一个生成问题。通过生成式建模,AIGB能够直接捕捉广告竞价过程中的复杂依赖关系,而无需依赖于马尔可夫假设。这使得AIGB在处理长期规划和随机环境时,能够更加稳定和有效。

在AIGB范式下,阿里妈妈开发了DiffBid模型,这是一种基于条件扩散建模的竞价生成方法。DiffBid通过直接建模广告收益与整个竞价轨迹之间的相关性,避免了传统方法中的时间步长误差传播问题。同时,DiffBid还能够灵活地生成满足特定目标和约束条件的竞价轨迹,为广告主提供了更多的选择和灵活性。

为了验证DiffBid的有效性,阿里妈妈在真实世界的数据集上进行了广泛的实验,并在阿里巴巴的广告平台上进行了在线A/B测试。实验结果表明,DiffBid在GMV(总交易额)和ROI(投资回报率)等关键指标上,均取得了显著的提升。具体而言,DiffBid实现了2.81%的GMV增长和3.36%的ROI增长,证明了其在实际应用中的价值和潜力。

从正面来看,AIGB和DiffBid的提出,为自动竞价技术的发展提供了新的思路和方法。通过生成式建模,AIGB范式能够更好地处理长期规划和随机环境,提高自动竞价的稳定性和效果。而DiffBid模型则通过条件扩散建模,实现了对竞价轨迹的灵活生成,为广告主提供了更多的选择和优化空间。这些创新性的突破,有望推动自动竞价技术在数字广告领域的进一步应用和发展。

然而,从反面来看,AIGB和DiffBid的提出也带来了一些挑战和问题。首先,生成式建模的复杂性,可能导致模型的训练和调优变得更加困难。其次,由于AIGB范式不再依赖于马尔可夫假设,如何在实际应用中确保模型的稳定性和可靠性,也是一个需要解决的问题。此外,如何将AIGB和DiffBid的创新性方法与其他广告技术相结合,以实现更全面的广告效果提升,也是一个值得探索的方向。

论文链接:https://arxiv.org/abs/2405.16141

目录
相关文章
|
人工智能 自然语言处理 算法
Quiet-STaR:让语言模型在“说话”前思考
**Quiet-STaR** 是一种增强大型语言模型(LLM)推理能力的方法,它扩展了原有的**STaR** 技术,允许LLM为其生成的文本自动生成推理步骤。通过令牌并行抽样和学习的思想令牌,模型能同时预测单词和相关原理。教师强化指导确保输出的正确性。Quiet-STaR提升LLM在句子预测、复杂问题解答和推理基准测试上的表现,降低困惑度,促进更流畅的生成过程。未来研究将探索视觉和符号理由,以及结合可解释AI以提高模型透明度和定制化。[\[arXiv:2403.09629\]](https://arxiv.org/abs/2403.09629)
889 4
|
2月前
|
数据采集 人工智能 搜索推荐
智能体来了:降本增效的终极杀手锏,销售人必看的生存指南
内容摘要:AI智能体(AI Agents)正重塑销售底层逻辑。本文深度拆解智能体如何通过自动化获客、个性化触达及全天候线索转化,协助销售人员打破内卷僵局,实现业绩呈指数级增长。
211 3
|
2月前
|
机器学习/深度学习 算法 机器人
多智能体强化学习(MARL)核心概念与算法概览
多智能体强化学习(MARL)研究多个智能体在共享环境中协同或竞争的决策问题。每个智能体拥有局部观测、独立策略,且环境因其他智能体的学习而动态变化,导致非平稳性、信用分配难、协调复杂等挑战。广泛应用包括交通控制、机器人协作、广告竞价等。常用方法如IQL、VDN、QMIX、MADDPG、MAPPO等,结合集中训练分布式执行(CTDE)提升稳定性。通过简单协调游戏可窥见MARL核心机制:智能体需在探索与协调间平衡,以涌现合作行为。
247 2
|
3月前
|
存储 人工智能 缓存
硬核解析:AI 原生知识库系统如何击穿企业知识管理技术瓶颈
AI原生开源知识库系统,以RAG+NLP双引擎重构知识管理全链路。通过语义解析、智能检索、自动文档生成等技术,实现非结构化数据的高效结构化与精准召回,支持多源内容导入、跨系统集成及企业级安全管控,兼具高性能、低门槛与强扩展性,助力企业打破信息孤岛,释放知识资产价值。
|
10月前
|
人工智能 JSON 运维
Dataphin MCP:让数据查询 “轻而易举”
Dataphin推出MCP服务,助力Agent高效获取数据,释放企业数据价值。
770 10
|
机器学习/深度学习 人工智能 算法
「我在淘天做技术」迈步从头越-阿里妈妈广告智能决策技术的演进之路
随着智能化营销产品和机器学习的发展,阿里妈妈将深度学习和强化学习等AI技术越来越多地应用到广告智能决策领域。本文将以阿里妈妈广告智能决策技术的演进为例,分享我们工作和思考。
|
人工智能 自然语言处理 算法
开源更新|语音生成大模型CosyVoice升级2.0版本
开源更新|语音生成大模型CosyVoice升级2.0版本

热门文章

最新文章