在线电视剧的受众竞争力预测和分析 | KDD论文解读

简介: 目前,网络视频平台的主要流量来自于热门电视剧,而平台的核心收益就是在这些流量上进行广告投放。通过准确预估剧目流量可以优化广告投放效果从而提高收益。但是,仅仅预测流量还不足以回答更深层次的问题。例如,平台未来要采购哪些剧目?这不仅要考虑剧目带来的流量,还要考虑平台内剧目的竞争关系,以避免造成热度内耗问题。所以,本文通过竞争力问题定义、算法设计以及实验对比,在剧目受众竞争力问题上进行了初步探索。

作者:张鹏,刘传仁,宁克锋,祝文祥,张宇

目前,网络视频平台的主要流量来自于热门电视剧,而平台的核心收益就是在这些流量上进行广告投放。通过准确预估剧目流量可以优化广告投放效果从而提高收益。但是,仅仅预测流量还不足以回答更深层次的问题。例如,平台未来要采购哪些剧目?这不仅要考虑剧目带来的流量,还要考虑平台内剧目的竞争关系,以避免造成热度内耗问题。所以,本文通过竞争力问题定义、算法设计以及实验对比,在剧目受众竞争力问题上进行了初步探索。
问题定义:
目前学术界并没有定义过剧目之间的竞争力,我们在调研过竞争力相关的文章后提出了一种剧目竞争力的定义。首先我们通过统计用户的观看次数,然后计算出两两剧目之间对用户观看次数的相对占有量,最后对所有用户取平均作为最终的竞争力。
我们以周为单位计算得到竞争力,进一步可以构建成为竞争网络图,图的节点为剧目,边是竞争力,这张竞争网络图是动态的,随着时间推移不断变化,而我们要预测的是未来网络图中每条边的数值,也就是剧目之间的竞争关系。下图是动态竞争网络的示意图,在已知T-2、T-1、T时刻的竞争网络,要预测T+1时刻的竞争网络。值得注意的是,动态竞争网络中的剧目不是一成不变的,旧剧往往在大结局之后一段时间会消失,而新剧在首播时会出现。
image.png

算法设计:

针对上述问题,我们结合深度神经网络和知识库系统设计了一种动态深度网络分解框架,并命名为Dynamic Deep Network Factorization (DDNF)。该框架可充分融合剧目的静态和动态特征以及竞争网络中的时序动态模式,优化剧目在动态竞争网络中的隐含表征,并用其有效预测未来的受众竞争力。框架共分为三个部分:第一部分是时序模块(Temporal Latent Factors),该模块利用张量分解从竞争网络中学习到剧目的时序隐含表征;第二部分是深度静态特征模块(Deep Embedding of Static Features),该模块利用知识库(KB)和深度神经网络(DNN)从静态特征中抽取剧目的关系和属性信息,静态特征主要包括了剧目的简介、题材、制作人员关系等;第三部分是循环动态特征模块(Recurrent Embedding of Dynamic Features),该模块利用长短期记忆网络(LSTM)从剧目的动态特征中抽取剧目的动态变化信息,动态特征包括了剧目每天的观看次数、点赞人数、更新状态等。最终将三个模块组合在一起,形成端到端的动态深度网络分解框架,示意图如下,绿色框表示时序模块,黄色框表示深度静态特征模块,紫色框表示循环动态特征模块。

image.png

实验对比:

我们利用某大型网络视频平台的历史数据,构建了剧目竞争力数据集,并利用该数据集进行实验。数据集包括了电视剧与综艺两个数据集,时间跨度为一年。同时,我们选取了经典矩阵分解算法PMF、时序矩阵分解算法BTMF、考虑额外信息的矩阵分解算法HBMFSI以及兼具时序和额外信息的ETF进行了对比,实验结果表明,我们的算法DDNF在两个数据集上都取得了最好的效果,同时,发现对于新剧的竞争力预估,DDNF表现更加突出。

image.png

总结:

针对网络电视剧目,本文首次提出了受众竞争力的建模和动态预测问题。论文首先通过挖掘剧目的观看记录构建一系列动态的竞争网络,然后结合深度神经网络和知识库系统设计了动态深度网络分解框架。该框架可以融合剧目的静态和动态特征以及竞争网络中的时序动态模式,优化剧目在动态竞争网络中的隐含表征,并用其有效预测未来的受众竞争力。通过预测剧目之间的竞争力刻画剧目的受众,对于视频平台的广告售卖、剧目采购计划、以及与其它平台的合作和竞争等决策任务。

更多数据挖掘内容查看:《KDD论文精华解读》

相关文章
|
机器学习/深度学习 搜索推荐 自然语言处理
KDD 2019 | 基于知识的个性化推荐理由生成解析
当前电商场景之下,单纯的商品推荐已不足以满足用户需求,基于内容的推荐应运而生。那么其中的关键问题就是我们要为推荐的商品产出优质的推荐理由,从而可以:帮助消费者做出选择;开拓用户对商品的兴趣;引导多种产品以提高多样性。
3218 0
|
8月前
|
机器学习/深度学习 存储 缓存
遍览数年历史视频、挖掘用户隐藏兴趣,快手终身行为建模方案TWIN入选KDD 2023
遍览数年历史视频、挖掘用户隐藏兴趣,快手终身行为建模方案TWIN入选KDD 2023
533 0
|
10月前
|
机器学习/深度学习 编解码 监控
再夺全球顶级竞赛CVPR NTIRE冠军,打造更好用户体验,淘宝拥有哪些内容技术?(1)
再夺全球顶级竞赛CVPR NTIRE冠军,打造更好用户体验,淘宝拥有哪些内容技术?
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
人人PyTorch,上A100能夺冠:分析完去年200场数据竞赛,我悟了
人人PyTorch,上A100能夺冠:分析完去年200场数据竞赛,我悟了
|
11月前
|
机器学习/深度学习 算法 数据可视化
精准高效估计多人3D姿态,美图&北航分布感知式单阶段模型入选CVPR 2022
精准高效估计多人3D姿态,美图&北航分布感知式单阶段模型入选CVPR 2022
|
11月前
|
SQL 存储 人工智能
多项榜单第一,达摩院算法工程师深度揭秘让表格说话的TableQA技术
多项榜单第一,达摩院算法工程师深度揭秘让表格说话的TableQA技术
117 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
30页论文!俞士纶团队新作:AIGC全面调查,从GAN到ChatGPT发展史
30页论文!俞士纶团队新作:AIGC全面调查,从GAN到ChatGPT发展史
133 0
|
机器学习/深度学习 人工智能 自然语言处理
预训练语言模型将屠榜CV?知乎热议:CVPR研究热点有哪些?3D任务热度持续飙升,无监督和自监督成新宠
CVPR成了人工智能研究领域的风向标。以最近刚刚公布的CVPR 2020录取情况来看,目前主流的热点研究问题有哪些较大的进展?相较于去年,研究热点的热度有哪些变化?未来的研究趋势会是什么呢?本文为您梳理脉络。
309 0
预训练语言模型将屠榜CV?知乎热议:CVPR研究热点有哪些?3D任务热度持续飙升,无监督和自监督成新宠
|
机器学习/深度学习 人工智能 编解码
这是什么选秀节目?数百万人看后想学「机器学习」
这是什么选秀节目?数百万人看后想学「机器学习」
171 0
这是什么选秀节目?数百万人看后想学「机器学习」
|
算法 计算机视觉
CVPR阿里优秀论文 | 基于时间尺度选择的在线行为预测
在线行为预测指的是当一个动作还未执行完之前,算法使用已经观测到的这些片段来预测该动作的类别。
1440 0