在线电视剧的受众竞争力预测和分析 | KDD论文解读

简介: 目前,网络视频平台的主要流量来自于热门电视剧,而平台的核心收益就是在这些流量上进行广告投放。通过准确预估剧目流量可以优化广告投放效果从而提高收益。但是,仅仅预测流量还不足以回答更深层次的问题。例如,平台未来要采购哪些剧目?这不仅要考虑剧目带来的流量,还要考虑平台内剧目的竞争关系,以避免造成热度内耗问题。所以,本文通过竞争力问题定义、算法设计以及实验对比,在剧目受众竞争力问题上进行了初步探索。

作者:张鹏,刘传仁,宁克锋,祝文祥,张宇

目前,网络视频平台的主要流量来自于热门电视剧,而平台的核心收益就是在这些流量上进行广告投放。通过准确预估剧目流量可以优化广告投放效果从而提高收益。但是,仅仅预测流量还不足以回答更深层次的问题。例如,平台未来要采购哪些剧目?这不仅要考虑剧目带来的流量,还要考虑平台内剧目的竞争关系,以避免造成热度内耗问题。所以,本文通过竞争力问题定义、算法设计以及实验对比,在剧目受众竞争力问题上进行了初步探索。
问题定义:
目前学术界并没有定义过剧目之间的竞争力,我们在调研过竞争力相关的文章后提出了一种剧目竞争力的定义。首先我们通过统计用户的观看次数,然后计算出两两剧目之间对用户观看次数的相对占有量,最后对所有用户取平均作为最终的竞争力。
我们以周为单位计算得到竞争力,进一步可以构建成为竞争网络图,图的节点为剧目,边是竞争力,这张竞争网络图是动态的,随着时间推移不断变化,而我们要预测的是未来网络图中每条边的数值,也就是剧目之间的竞争关系。下图是动态竞争网络的示意图,在已知T-2、T-1、T时刻的竞争网络,要预测T+1时刻的竞争网络。值得注意的是,动态竞争网络中的剧目不是一成不变的,旧剧往往在大结局之后一段时间会消失,而新剧在首播时会出现。
image.png

算法设计:

针对上述问题,我们结合深度神经网络和知识库系统设计了一种动态深度网络分解框架,并命名为Dynamic Deep Network Factorization (DDNF)。该框架可充分融合剧目的静态和动态特征以及竞争网络中的时序动态模式,优化剧目在动态竞争网络中的隐含表征,并用其有效预测未来的受众竞争力。框架共分为三个部分:第一部分是时序模块(Temporal Latent Factors),该模块利用张量分解从竞争网络中学习到剧目的时序隐含表征;第二部分是深度静态特征模块(Deep Embedding of Static Features),该模块利用知识库(KB)和深度神经网络(DNN)从静态特征中抽取剧目的关系和属性信息,静态特征主要包括了剧目的简介、题材、制作人员关系等;第三部分是循环动态特征模块(Recurrent Embedding of Dynamic Features),该模块利用长短期记忆网络(LSTM)从剧目的动态特征中抽取剧目的动态变化信息,动态特征包括了剧目每天的观看次数、点赞人数、更新状态等。最终将三个模块组合在一起,形成端到端的动态深度网络分解框架,示意图如下,绿色框表示时序模块,黄色框表示深度静态特征模块,紫色框表示循环动态特征模块。

image.png

实验对比:

我们利用某大型网络视频平台的历史数据,构建了剧目竞争力数据集,并利用该数据集进行实验。数据集包括了电视剧与综艺两个数据集,时间跨度为一年。同时,我们选取了经典矩阵分解算法PMF、时序矩阵分解算法BTMF、考虑额外信息的矩阵分解算法HBMFSI以及兼具时序和额外信息的ETF进行了对比,实验结果表明,我们的算法DDNF在两个数据集上都取得了最好的效果,同时,发现对于新剧的竞争力预估,DDNF表现更加突出。

image.png

总结:

针对网络电视剧目,本文首次提出了受众竞争力的建模和动态预测问题。论文首先通过挖掘剧目的观看记录构建一系列动态的竞争网络,然后结合深度神经网络和知识库系统设计了动态深度网络分解框架。该框架可以融合剧目的静态和动态特征以及竞争网络中的时序动态模式,优化剧目在动态竞争网络中的隐含表征,并用其有效预测未来的受众竞争力。通过预测剧目之间的竞争力刻画剧目的受众,对于视频平台的广告售卖、剧目采购计划、以及与其它平台的合作和竞争等决策任务。

更多数据挖掘内容查看:《KDD论文精华解读》

相关文章
|
机器学习/深度学习 人工智能 达摩院
[ICML'22] 阿里巴巴达摩院FEDformer,长程时序预测全面超越SOTA
本文介绍阿里巴巴达摩院决策智能实验室时间序列预测方向的最新(ICML 2022 accepted)工作:FEDformer: Frequency Enhanced Decomposed Transformer for Long-term Series Forecasting论文链接:https://arxiv.org/abs/2201.12740代码链接:https://github.com/DA
3480 0
[ICML'22] 阿里巴巴达摩院FEDformer,长程时序预测全面超越SOTA
|
安全 编译器 开发者
【Qt 学习笔记】Qt信号和槽的其他说明及Lambda表达式
【Qt 学习笔记】Qt信号和槽的其他说明及Lambda表达式
700 0
|
Ubuntu Linux
查看Linux系统架构的命令,查看linux系统是哪种架构:AMD、ARM、x86、x86_64、pcc 或 查看Ubuntu的版本号
查看Linux系统架构的命令,查看linux系统是哪种架构:AMD、ARM、x86、x86_64、pcc 或 查看Ubuntu的版本号
5185 4
基于电压矢量变换的锁相环simulink建模与仿真
本课题基于电压矢量变换的锁相环(PLL)在MATLAB2022a中进行Simulink建模与仿真。该模型通过ab坐标变换和低通滤波,实现对三相电网电压的快速准确锁相,尤其在电压不平衡条件下表现优异。系统仿真结果显示,PLL能有效提取基波正序电压分量,适用于负序电压前馈控制及双序电流环控制策略。相比传统单相PLL,该方法更稳健地应对电网不平衡和频率突变,广泛应用于电力质量监测、三相PFC电路控制及分布式发电系统的并网控制等领域。
|
机器学习/深度学习 自然语言处理 PyTorch
【自然语言处理NLP】Bert预训练模型、Bert上搭建CNN、LSTM模型的输入、输出详解
【自然语言处理NLP】Bert预训练模型、Bert上搭建CNN、LSTM模型的输入、输出详解
1092 0
|
Ubuntu Python
ubuntu build install python3.12 and config pip
该脚本用于在 Ubuntu 上编译安装 Python 3.12,并配置 pip 使用国内镜像源。主要步骤包括安装依赖、下载并解压 Python 源码、编译安装、创建符号链接、配置 pip 源,以及验证安装和更新 pip。通过运行此脚本,可以快速完成 Python 3.12 的安装和配置。
1919 0
|
SQL Java 数据库连接
ORM框架的发展历史
最初的时候是直接通过jdbc来直接操作数据库的,如果本地数据库有一张t_user表,那么操作流程是
389 0
|
XML 测试技术 网络安全
开发工具:USB转IIC/I2C/SPI/UART适配器模块可编程开发板
总的思路是通过USB或者UART接口发送一些协议字符串,由模块转换成上面几种接口的硬件时序电信号,实现与这几种接口芯片、设备的快速测试。 首先声明一下,大家都是搞硬件开发的,这几种接口当然是很简单的事,但有些时候对于一个新的设备或者芯片的测试,有个现成的工具当然更顺手,节省时间,也更可靠嘛。
|
存储 算法 搜索推荐
排序算法的复杂度及稳定性详解(内含记忆小窍门)
排序算法的复杂度及稳定性详解(内含记忆小窍门)
排序算法的复杂度及稳定性详解(内含记忆小窍门)

热门文章

最新文章