在线电视剧的受众竞争力预测和分析 | KDD论文解读

简介: 目前,网络视频平台的主要流量来自于热门电视剧,而平台的核心收益就是在这些流量上进行广告投放。通过准确预估剧目流量可以优化广告投放效果从而提高收益。但是,仅仅预测流量还不足以回答更深层次的问题。例如,平台未来要采购哪些剧目?这不仅要考虑剧目带来的流量,还要考虑平台内剧目的竞争关系,以避免造成热度内耗问题。所以,本文通过竞争力问题定义、算法设计以及实验对比,在剧目受众竞争力问题上进行了初步探索。

作者:张鹏,刘传仁,宁克锋,祝文祥,张宇

目前,网络视频平台的主要流量来自于热门电视剧,而平台的核心收益就是在这些流量上进行广告投放。通过准确预估剧目流量可以优化广告投放效果从而提高收益。但是,仅仅预测流量还不足以回答更深层次的问题。例如,平台未来要采购哪些剧目?这不仅要考虑剧目带来的流量,还要考虑平台内剧目的竞争关系,以避免造成热度内耗问题。所以,本文通过竞争力问题定义、算法设计以及实验对比,在剧目受众竞争力问题上进行了初步探索。
问题定义:
目前学术界并没有定义过剧目之间的竞争力,我们在调研过竞争力相关的文章后提出了一种剧目竞争力的定义。首先我们通过统计用户的观看次数,然后计算出两两剧目之间对用户观看次数的相对占有量,最后对所有用户取平均作为最终的竞争力。
我们以周为单位计算得到竞争力,进一步可以构建成为竞争网络图,图的节点为剧目,边是竞争力,这张竞争网络图是动态的,随着时间推移不断变化,而我们要预测的是未来网络图中每条边的数值,也就是剧目之间的竞争关系。下图是动态竞争网络的示意图,在已知T-2、T-1、T时刻的竞争网络,要预测T+1时刻的竞争网络。值得注意的是,动态竞争网络中的剧目不是一成不变的,旧剧往往在大结局之后一段时间会消失,而新剧在首播时会出现。
image.png

算法设计:

针对上述问题,我们结合深度神经网络和知识库系统设计了一种动态深度网络分解框架,并命名为Dynamic Deep Network Factorization (DDNF)。该框架可充分融合剧目的静态和动态特征以及竞争网络中的时序动态模式,优化剧目在动态竞争网络中的隐含表征,并用其有效预测未来的受众竞争力。框架共分为三个部分:第一部分是时序模块(Temporal Latent Factors),该模块利用张量分解从竞争网络中学习到剧目的时序隐含表征;第二部分是深度静态特征模块(Deep Embedding of Static Features),该模块利用知识库(KB)和深度神经网络(DNN)从静态特征中抽取剧目的关系和属性信息,静态特征主要包括了剧目的简介、题材、制作人员关系等;第三部分是循环动态特征模块(Recurrent Embedding of Dynamic Features),该模块利用长短期记忆网络(LSTM)从剧目的动态特征中抽取剧目的动态变化信息,动态特征包括了剧目每天的观看次数、点赞人数、更新状态等。最终将三个模块组合在一起,形成端到端的动态深度网络分解框架,示意图如下,绿色框表示时序模块,黄色框表示深度静态特征模块,紫色框表示循环动态特征模块。

image.png

实验对比:

我们利用某大型网络视频平台的历史数据,构建了剧目竞争力数据集,并利用该数据集进行实验。数据集包括了电视剧与综艺两个数据集,时间跨度为一年。同时,我们选取了经典矩阵分解算法PMF、时序矩阵分解算法BTMF、考虑额外信息的矩阵分解算法HBMFSI以及兼具时序和额外信息的ETF进行了对比,实验结果表明,我们的算法DDNF在两个数据集上都取得了最好的效果,同时,发现对于新剧的竞争力预估,DDNF表现更加突出。

image.png

总结:

针对网络电视剧目,本文首次提出了受众竞争力的建模和动态预测问题。论文首先通过挖掘剧目的观看记录构建一系列动态的竞争网络,然后结合深度神经网络和知识库系统设计了动态深度网络分解框架。该框架可以融合剧目的静态和动态特征以及竞争网络中的时序动态模式,优化剧目在动态竞争网络中的隐含表征,并用其有效预测未来的受众竞争力。通过预测剧目之间的竞争力刻画剧目的受众,对于视频平台的广告售卖、剧目采购计划、以及与其它平台的合作和竞争等决策任务。

更多数据挖掘内容查看:《KDD论文精华解读》

相关文章
|
机器学习/深度学习 搜索推荐 自然语言处理
KDD 2019 | 基于知识的个性化推荐理由生成解析
当前电商场景之下,单纯的商品推荐已不足以满足用户需求,基于内容的推荐应运而生。那么其中的关键问题就是我们要为推荐的商品产出优质的推荐理由,从而可以:帮助消费者做出选择;开拓用户对商品的兴趣;引导多种产品以提高多样性。
3420 0
|
8月前
|
人工智能 自然语言处理 监控
GPT-4整治学术不端!人大/浙大团队实测7000篇论文,撤稿预测与人类95%一致
【4月更文挑战第15天】中国人民大学和浙江大学的研究团队利用GPT-4模型预测论文撤稿,研究基于3,505篇撤稿及未撤稿论文的推特数据,发现16%的撤稿论文提及含有预警信号,预测准确度高达92.86%。GPT-4预测一致性达95%,为学术诚信监控提供新途径。但研究受限于主观偏见、撤稿原因区分及推特互动等因素。
115 1
GPT-4整治学术不端!人大/浙大团队实测7000篇论文,撤稿预测与人类95%一致
|
8月前
|
机器学习/深度学习 算法 搜索推荐
数据分享|R语言谱聚类社会化推荐挖掘协同过滤电影社交网站Flixster数据集应用研究
数据分享|R语言谱聚类社会化推荐挖掘协同过滤电影社交网站Flixster数据集应用研究
|
机器学习/深度学习 算法 数据可视化
精准高效估计多人3D姿态,美图&北航分布感知式单阶段模型入选CVPR 2022
精准高效估计多人3D姿态,美图&北航分布感知式单阶段模型入选CVPR 2022
141 0
|
机器学习/深度学习 存储 人工智能
AI分析手机实现精准扶贫:伯克利研究登上Nature
AI分析手机实现精准扶贫:伯克利研究登上Nature
104 0
|
机器学习/深度学习 算法 搜索推荐
CIKM论文解读 | 淘宝内容化推荐场景下对多场景全域表征的思考与应用
我们结合逛逛推荐场景中的具体问题,从多场景全域表征的视角进行了一系列的探索与内容推荐场景的应用,从全域表征的范围、信息迁移方式以及模型框架的应用等维度展开我们的优化工作,取得了阶段性的优化经验和业务效果。
934 0
|
机器学习/深度学习 人工智能 自然语言处理
30页论文!俞士纶团队新作:AIGC全面调查,从GAN到ChatGPT发展史
30页论文!俞士纶团队新作:AIGC全面调查,从GAN到ChatGPT发展史
172 0
|
机器学习/深度学习 人工智能 大数据
Nature发表Google新型AI系统!乳腺癌筛查完胜人类专家
今天Google在人工智能医学影像上又获突破!该AI系统可对钼靶影像数据进行大规模分析和处理,大幅降低假阳性与假阴性,并完胜6名放射科医师,还能降低劳动力使用量,为全面提高乳腺癌筛查的准确性奠定了基础。
229 0
Nature发表Google新型AI系统!乳腺癌筛查完胜人类专家
|
机器学习/深度学习 人工智能 安全
不满复工政策,苹果机器学习总监辞职,疯狂的 AI 天才 29 岁提出 GAN 模型
美国当地时间 5 月 7 日,有消息称苹果机器学习总监 Ian Goodfellow 宣布辞职,离开了加入三年的苹果公司,而后 Goodfellow 在一封发给员工的电子邮件中确认这一消息。虽然并不清楚 Goodfellow 的主要离职原因,但他在邮件中提到了自己对复工计划的一些不满看法。
174 0
|
机器学习/深度学习 并行计算 PyTorch
机器学习之阿里云天池大赛—新闻分类
本文为作者参加阿里云天池大赛入门赛中新闻分类比赛的记录。
478 0
机器学习之阿里云天池大赛—新闻分类

热门文章

最新文章