社区内容流量调控系统设计——成本与指标平衡的背后

简介: 运营可干预的内容分发流量调控实现

作者:闲鱼技术——司远

背景

在闲鱼,除了可以进行闲置交易,当你点击第二个tab“会玩”后,还会发现一个好玩、有趣的内容社区。内容分发作为社区的重要环节,核心目标是实现内容与用户之间的匹配效率最大化,核心指标就是内容的点击率(CTR)和停留时长,这也正是算法推荐模型的优化方向。然后运营在内容分发环节有着各种各样的需求,主要有以下几类:
image.png

  • 活动运营:对于社会热点、节日氛围和品牌活动相关的内容,运营需要进行提前布局,给予更多流量。
  • 社区生态:存量的内容由于历史积累的行为数据更多,更容易被算法推荐,导致流量分发存在马太效应,内容新鲜度不够。同时对于擦边球的内容,虽然CTR很高,但是从长期平台生态来看,需要限制其流量。
  • 流量扶持:对于核心内容创作者、BD作者,运营需要进行一定的流量扶持,长期来看可以促进内容供给。

如果单纯依赖推荐算法实现以上需求会带来2个问题,一是开发成本高,二是有的运营需求短期会带来核心指标的下降,和算法模型的优化目标是冲突的。
因此我们设计了一套流量调控系统,面向运营提供灵活的流量调控能力,在内容分发时打通推荐算法,快速实现运营需求,同时兼顾核心业务指标。

系统整体设计

image-20210720112351543
运营的需求整体可抽象为两类:

  1. 针对具体内容的流量调控任务,核心是对具体内容,在具体时间、具体分发场景、针对具体目标人群、实现具体的调控目标(曝光量)。
  2. 基于规则的流量调控,即当特定事件发生时,自动生成流量调控任务。比如当特定等级的创作者发布了特定质量的内容时,我们在一阶段给与一定的曝光量,如果曝光目标完成后,同时CTR指标达到一定标准,会再次给予一定的曝光量。

针对上面的需求,我们设计了策略链路动态创建具体调控任务,然后通过调控链路实现调控任务的管理和调度,同时调控链路也支持运营手动创建调控任务。

分发链路则打通了推荐系统,在完成调控任务的同时,尽可能的优化核心指标。

流量数据处理服务负责采集用户的曝光埋点数据,为流量调控模块提供实时的调控任务状态更新,同时沉淀数据资产,供流量洞察分析使用,最终在流量策略中心运营后台为运营提供决策支撑。限于篇幅,这部分内容后续有机会再和大家分享。

具体方案实现

核心策略核心流程.svg

策略链路

策略事件接入将各种异构的消息事件进行归一化处理,形成标准的策略事件,供后续的各种策略执行器进行订阅。
image.png
运营的各种调控策略被抽象为标准的策略处理器(StrategyManager),当监听到策略事件后,策略路由器将其转发给订阅了该事件的策略执行器,策略执行器处理事件,创建相应的调控任务。
image.png

调控链路

调控任务生成后,经过任务调度,实时同步到算法所需的调控内容池(采用图数据库存储),进行后续的内容分发。当内容在指定的分发场景曝光后,数据采集模块会实时采集客户端上报的用户行为日志埋点,进行3部分操作:

  • 通过处理产生曝光、点击等数据指标并存储。
  • 产生干预消息,实时更新调控内容池。
  • 判断指标是否达到目标曝光值,产生任务结束消息,结束任务调控。

数据采集需要满足高吞吐、低延时,采用流处理平台实现。
image.png

分发链路

  • 召回:推荐系统在收到前台请求的时候,同时从调控内容池(冷启动内容池、保量内容池)以及大盘正常召回链路进行个性化召回,保证即使是调控内容,也和用户兴趣相匹配。
  • 排序:推荐系统会通过相关的核心指标预估模型,以及特定类型调控任务(如冷启动)的算法模型,对内容进行排序。投放系统会根据运营设置的优先级,进行排序。

总结和展望

目前实现了运营保量投放能力,以及特定创作者的内容冷启动策略,其中

  • 运营手动保量投放调控日新增任务数30+,调控曝光百万级别。
  • 针对特定作者的冷启动调控业务实现了对于优质创作者的流量扶持,极大地激励了创作者积极性,日均发帖量提升14.4%。

后续针对流量调控系统将进行进一步的能力升级:

  • 多目标调控,除曝光量外增加点击,甚至涨粉能力。
  • 策略配置化。当前通过代码的方式实现运营策略,后续可实现调控策略配置化,热更新。实现运营策略的0代码、SOP化支持。
相关文章
|
3月前
|
存储 前端开发 JavaScript
前端技术趋势:在动态变化中寻求稳定
【10月更文挑战第7天】前端技术趋势:在动态变化中寻求稳定
65 0
|
8月前
|
机器学习/深度学习 数据挖掘 物联网
【专栏】机器学习如何通过预测性维护、负载预测、动态冷却管理和能源效率优化提升数据中心能效
【4月更文挑战第27天】随着信息技术发展,数据中心能耗问题日益突出,占全球电力消耗一定比例。为提高能效,业界探索利用机器学习进行优化。本文讨论了机器学习如何通过预测性维护、负载预测、动态冷却管理和能源效率优化提升数据中心能效。然而,数据质量、模型解释性和规模化扩展是当前挑战。未来,随着技术进步和物联网发展,数据中心能效管理将更智能自动化,机器学习将在实现绿色高效发展中发挥关键作用。
141 5
|
5月前
|
机器学习/深度学习 人工智能
阿里轨迹可控版Sora,告别抽卡,让视频生成更符合物理规律
【8月更文挑战第26天】阿里团队新推出的Tora视频生成模型是对先前Sora模型的重要升级。Tora通过引入轨迹控制机制,极大提升了视频中物体运动的真实性和准确性。其核心技术包括轨迹提取器、运动指导融合器及空间时间扩散变换器,共同确保视频既高质量又流畅。实验表明,Tora在清晰度、细节表现力及运动轨迹控制上均有显著进步。尽管如此,模型训练复杂度和轨迹理解能力仍有待优化。[论文](https://arxiv.org/pdf/2407.21705)
56 2
|
存储 运维 容灾
带你读《多媒体行业质量成本优化及容灾方案白皮书》1. 成本优化概述
带你读《多媒体行业质量成本优化及容灾方案白皮书》1. 成本优化概述
415 0
|
数据采集 机器学习/深度学习 存储
量化高频交易系统策略模型开发搭建
量化高频交易系统策略模型开发搭建
|
存储 网络性能优化 调度
开源代码分享(2)—综合能源系统零碳优化调度
在PDN的最优运行中需要制定电压、无功功率和相应的无功补偿器以维持无功功率平衡和电压质量。此外,大多数现有的联合供热和电力系统使用CHP作为PDN和DHN之间的接口,这无疑与零碳排放的要求背道而驰。因此,我们打算为提出的ZCE-MEI综合NSF-CAES开发一个短期日前调度模型来减少风能的削减和节约系统运行成本。
|
缓存 负载均衡 监控
聊个简单的话题:如何分析性能需求?
一般来说,云服务的可用区,可以理解为同一个机房的不同虚拟机集群。为了避免某个可用区由于网络硬盘等原因损坏导致服务不可用,跨可用区的服务部署是一种常见的容灾手段。
聊个简单的话题:如何分析性能需求?
|
数据挖掘 测试技术 数据处理
数据分析实战 | A/B测试探寻哪种广告点击率更高?
数据分析实战 | A/B测试探寻哪种广告点击率更高?
数据分析实战 | A/B测试探寻哪种广告点击率更高?
|
机器学习/深度学习 弹性计算 人工智能
滴滴派单算法_从算法模型思路到评估方案 - 详解
导读:说到滴滴的派单算法,大家可能感觉到既神秘又好奇,从出租车扬召到司机在滴滴平台抢单最后到平台派单,大家今天的出行体验已经发生了翻天覆地的变化,面对着每天数千万的呼叫,滴滴的派单算法一直在持续努力让更多人打到车,本篇文章会着重介绍我们是如何分析和建模这个问题,并且这其中面临了怎样的算法挑战,以及介绍一些我们常用的派单算法,这些算法能够让我们不断的提升用户的打车确定性。
7873 0
滴滴派单算法_从算法模型思路到评估方案 - 详解
|
SQL 弹性计算 算法
深度技术揭秘 | 大促狂欢背后,如何有效评估并规划数据库计算资源?
经过“双11”、“618”这类互联网促销活动的验证,越来越多的互联网公司采用不定期营销活动来刺激消费,达到提升营收能力的目标。然而,在每一次业务狂欢的背后,如何科学地为促销活动准备相应的计算资源就变成了困扰开发人员的常态问题。此外,据Gartner统计,在疫情的影响下越来越多的企业开始加速关键业务模块从本地云往公有云上迁移,以提升企业服务的稳定性和容灾能力。如何有效评估并规划计算能力、计算引擎、带宽等关键资源的容量成为了云场景下的一项技术挑战。
1255 0
深度技术揭秘 | 大促狂欢背后,如何有效评估并规划数据库计算资源?

热门文章

最新文章