互联网智能广告系统简易流程与架构 | 架构师之路

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 很多朋友估计没有做过这一块,争取最简洁的语言描述清楚。

很多朋友估计没有做过这一块,争取最简洁的语言描述清楚。

一、业务简述

image.png

从业务上看 整个智能广告系统,主要分为:

1)业务端:广告主的广告后台

2)展现端:用户实际访问的页面

业务端,广告主主要有两类行为:

1)广告设置行为:例如设置投放计划,设置地域,类别,关键字,竞价等

2)效果查看行为:例如广告展示次数是多少,广告点击次数是多少等

展现端,用户主要也有两类行为:

1)站点浏览行为:用户浏览实际的信息,此时广告系统决定出广告主的什么广告

2)广告点击行为:此时广告系统会对广告主进行扣费

二、业务流程

下面通过一个的例子,让业务流程更直观。

步骤一:广告主在业务端投递广告

广告主登录业务端后台,进行设置:

今日投放地域是“北京-上地”

投放类别是“租房”

定向人群为“女”,“30岁以下”

需要推广的广告内容是他发布的一条“房屋出租”的帖子

竞价设置的是0.2元

单日预算是20元

这些数据,当然通过业务端存储到了数据层,即数据库和缓存里。

步骤二:用户来到了网站,进入了“北京-上地-租房”类别,广告初筛实施

用户产生了平台浏览行为,网站除了展示自然内容,还要展示广告内容。被展现的广告不能太离谱,太离谱用户也不会点击。

image.png

合适的广告,必须符合“语义相关性”,即基础检索属性(广告属性)必须符合(广告能否满足用户的需求,满足了点击率才高),这个工作是通过BS-basic search检索服务完成的。

BS从数据层检索到“北京-上地-租房”的广告帖子。

步骤三:用户属性与广告主属性匹配,广告精筛实施

步骤二中,基础属性初筛了以后,要进行更深层次的策略筛选(用户能否满足广告的需求),此例中,广告主的精准需求为:

用户性别为“女”

用户年龄为“30岁以下”

用户访问IP是“北京”

image.png

系统将初筛出来的M条广告和用户属性进行匹配筛选,又过滤掉了一部分,最后剩余N条待定广告,这些广告既满足用户的需求(初筛),这些用户也满足广告主的需求(精筛),后者是在AS-advanced search策略服务完成的。

步骤四:综合排序,并返回Top X的广告

经过步骤2和步骤3的初筛和精筛之后,待选的N条广告既能满足用户当前的需求,用户亦能满足广告主的筛选需求,但实际情况是,广告位只有3个,怎么办呢?就需要我们对N条广告进行综合打分排序(满足平台的需求,广告平台要多赚钱嘛)。

打分排序的依据是什么呢?

有人说按照竞价排序bid,出价高的打分高(这是大家对百度最大的误解,百度是cpc收费)

有人说按照CTR点击率排序,CTR高的点的人多(百度的kpi指标可不是pv)

出价高,但没人点击,广告平台没有收益;点击率高,但出价低,广告平台还是没有收益。最终应该按照广告的出价与CTR的乘积作为综合打分排序的依据,bid*CTR。

既然bid*CTR是所有广告综合打分的依据,且出价bid又是广告主事先设定好的,那么实际上,广告排序问题的核心又转向了广告CTR的预测,CTR预测是推荐系统、广告系统、搜索系统里非常重要的一部分,是一个工程,算法,业务三方结合的问题,本文就不展开讨论了。

无论如何,N条广告,根据bid*预估CTR进行综合打分排序后,返回了打分最高的3个广告(广告位只有3个)。

有些系统没有第二步骤用户属性过滤,而是将用户属性因素考虑到综合排序中。

步骤五:展现端展示了广告,用户点击了广告

展示了广告后,展现端js会上报广告展示日志,有部分用户点击了广告,服务端会记录点击日志,这些日志可以作为广告算法实施的数据源,同时,他们经过统计分析之后,会被展示给广告主,让他们能够看到自己广告的展示信息,点击信息。

这些日志(一般会实施AB测),也是算法效果好坏评估的重要依据,根据效果逐步优化改进算法。

步骤六:对广告主进行扣费

用户既然点击了广告,平台就要对投放广告的广告主进行扣费了,扣费前当然要经过反作弊系统的过滤(主要是恶意点击),扣费后信息会实时反映到数据层,费用扣光后,广告就要从数据层下线。

三、系统综述

image.png

聊完业务流程,再来看系统架构,任何脱离业务的架构设计都是耍流氓。

从系统分层架构上看,智能广告系统分为三层:

站点层:用户和广告主直接面向的网站站点

服务层:为了实现智能广告的业务逻辑,提供的通用服务,此处又主要分为四大类服务:

策略服务BS:实施广告策略,综合排序

检索服务AS:语义相关性检索

计费服务:用户点击广告时进行扣费

反作弊服务:不是每次点击都扣费,要经过反作弊,去除恶意点击(相对独立,未在架构图中画出)

数据层:用户数据,广告数据,竞价数据,日志数据等等等等

四、总结

智能广告系统的业务流程与系统架构:

1)广告主投放与设置广告

2)用户访问平台,展现合适广告

通过广告属性,进行“语义相关性”初筛,通过BS完成

通过用户属性,出价信息,点击率预测信息,进行综合打分排序筛选,通过AS完成

3)记录展现日志,点击日志,进行扣费

广告是展现,是一个:

广告满足用户需求(初筛)

用户满足广告需求(精筛)

平台利益最大化(bid*CTR综合排序)

的过程

广告的排序不是由出价(bid)决定的,而是由出价(bid)*点击率(ctr)决定的。

点击率(ctr)是一个未来将要发生的行为,智能广告系统的核心与难点是点击率预测。

==【完】==

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
2月前
|
机器学习/深度学习 文字识别 监控
安全监控系统:技术架构与应用解析
该系统采用模块化设计,集成了行为识别、视频监控、人脸识别、危险区域检测、异常事件检测、日志追溯及消息推送等功能,并可选配OCR识别模块。基于深度学习与开源技术栈(如TensorFlow、OpenCV),系统具备高精度、低延迟特点,支持实时分析儿童行为、监测危险区域、识别异常事件,并将结果推送给教师或家长。同时兼容主流硬件,支持本地化推理与分布式处理,确保可靠性与扩展性,为幼儿园安全管理提供全面解决方案。
135 3
|
3月前
|
资源调度 监控 调度
基于SCA的软件无线电系统的概念与架构
软件通信体系架构(SCA)是基于软件定义无线电(SDR)思想构建的开放式、标准化和模块化平台,旨在通过软件实现通信功能的灵活配置。SCA起源于美军为解决“信息烟囱”问题而推出的联合战术无线电系统(JTRS),其核心目标是提升多军种联合作战通信能力。 上海介方信息公司的OpenSCA操作环境严格遵循SCA4.1/SRTF标准,支持高集成、嵌入式等场景,适用于军用通信、雷达等领域。 SCA体系包括目标平台资源层(TRL)、环境抽象层(EAL)、SRTF操作环境(OE)及应用层(AL)。其中,SRTF操作环境包含操作系统、运行时环境(RTE)和核心框架(CF),提供波形管理、资源调度等功能。
【YashanDB知识库】如何排查YMP报错:”OCI版本为空或OCI的架构和本地系统的架构不符“
【YashanDB知识库】如何排查YMP报错:”OCI版本为空或OCI的架构和本地系统的架构不符“
【YashanDB知识库】如何排查YMP报错:”OCI版本为空或OCI的架构和本地系统的架构不符“
|
17天前
|
数据采集 存储 算法
人才招聘系统开发全解析:从技术底层到商业逻辑的完整架构优雅草卓伊凡|小无|果果|阿才
人才招聘系统开发全解析:从技术底层到商业逻辑的完整架构优雅草卓伊凡|小无|果果|阿才
59 2
人才招聘系统开发全解析:从技术底层到商业逻辑的完整架构优雅草卓伊凡|小无|果果|阿才
|
2月前
|
人工智能 自然语言处理 API
MCP与A2A协议比较:人工智能系统互联与协作的技术基础架构
本文深入解析了人工智能领域的两项关键基础设施协议:模型上下文协议(MCP)与代理对代理协议(A2A)。MCP由Anthropic开发,专注于标准化AI模型与外部工具和数据源的连接,降低系统集成复杂度;A2A由Google发布,旨在实现不同AI代理间的跨平台协作。两者虽有相似之处,但在设计目标与应用场景上互为补充。文章通过具体示例分析了两种协议的技术差异及适用场景,并探讨了其在企业工作流自动化、医疗信息系统和软件工程中的应用。最后,文章强调了整合MCP与A2A构建协同AI系统架构的重要性,为未来AI技术生态系统的演进提供了方向。
615 62
|
1月前
|
人工智能 Cloud Native 容灾
深圳农商银行三代核心系统全面投产 以云原生架构筑牢数字化转型基石
深圳农商银行完成第三代核心系统全面上云,日均交易超3000万笔,峰值处理效率提升2倍以上。扎根深圳70余年,与阿里云共建“两地三中心”分布式云平台,实现高可用体系及全栈护航。此次云原生转型为行业提供可复制样本,未来将深化云计算与AI合作,推动普惠金融服务升级。
219 17
|
2月前
|
存储 人工智能 开发框架
MCP 实践:基于 MCP 架构实现知识库答疑系统
文章探讨了AI Agent的发展趋势,并通过一个实际案例展示了如何基于MCP(Model Context Protocol)开发一个支持私有知识库的问答系统。
MCP 实践:基于 MCP 架构实现知识库答疑系统
|
2月前
|
存储 人工智能 自然语言处理
Cursor这类编程Agent软件的模型架构与工作流程
编程Agent的核心是一个强大的大语言模型,负责理解用户意图并生成相应的代码和解决方案。这些模型通过海量文本和代码数据的训练,掌握了广泛的编程知识和语言理解能力。
152 1
|
3月前
|
人工智能 运维 Cloud Native
2025年国内工单系统推荐:技术架构、场景适配与行业实践
分析了智能化升级、大数据驱动、云原生架构及全渠道融合四大技术趋势,从功能适配性、易用性、集成能力、安全性和性价比五个维度指导企业选型,并推荐合力亿捷等三家系统的优劣对比,结合电商和制造行业的实际案例,帮助企业提升客户服务水平与竞争力。
232 11
2025年国内工单系统推荐:技术架构、场景适配与行业实践