挑演员?选剧本?大数据说了到底算不算

简介:

一部电影或一部电视剧,想要获得观众认可,除了拥有高颜值、高演技的演员外,很大程度上依靠的还是编剧精心的剧情设置。7月22日的“影视遇到大数据巅峰思享会”上,关于机器能否读懂并筛选剧本的问题引发了影视圈与数据界的巨大关注。

来源:数据猿 记者:张叶

  来源:数据猿 记者:张叶

精彩继续!

一部电影或一部电视剧,想要获得观众认可,除了拥有高颜值、高演技的演员外,很大程度上依靠的还是编剧精心的剧情设置。换言之,剧本始终还是影视剧获得高收视的制胜法宝。

此次分享会上,关于机器能否读懂并筛选剧本的问题引发了影视圈与数据界的巨大关注。

在影视从业者看来,数据参与影视制作与推广的过程,可能更多的是对演员、导演的评估、对观众喜好的统计,以及利用线上线下数据对票房的预判行为。那么利用大数据,究竟能不能让机器对剧本做很好前期筛选呢?我们来听听爱梦娱乐的雷鸣怎么说?

挑演员?选剧本?大数据说了到底算不算

  雷鸣 ABD爱梦娱乐CEO

雷鸣:ABD爱梦娱乐是一家研究娱乐媒介的公司。所谓的娱乐媒介,包括明星艺人、院线电影、周播电视剧、网络内容等方面内容。但我不觉得爱梦娱乐就是一家纯粹的大数据公司,因为我们搜集这些数据,主要是研究它们在娱乐市场上可能会导致的结果。

我们在艺人和影视内容方面做了两年多研究,现在整个团队对院线电影和网剧内容有很高的商业敏感度。我们的很多市场分析结果,也跟传统人士看法不一样。

我们发现,所谓公开的数据和我们得到的数据,比如舆情监控,其实并没有真正解决影视制作过程中的很多本质问题。大家用到的一些指数,实际上有很多盲点。另外,在内容模型上,我们觉得剧本类型即市场,市场即观众,也就是说剧本决定了一部片子本质上针对的人群会是哪些,但对一部真正的院线电影而言,在剧本选择阶段会耗费大量精力。

所以我们现在在教机器读剧本,做早期筛查。而且机器不仅要读懂剧本,读完之后还要给出分析结果,比如,这个剧本拍摄完成之后,电影明年上映,那么在不同档期里的票房区间可能会是多少?

这件事听起来匪夷所思。但事实上,从今年1月到3月,我们已经搜集了过去3到5年上映的、有票房结果的、不同类型的大概100部电影,之后将这100部电影剧本作为机器的训练册,最终机器给出的分析结果,与电影实际票房相比,准确率能达到25%。

挑演员?选剧本?大数据说了到底算不算

  牟蕾 数据猿创始人(左)

牟蕾:你们具体怎么教机器阅读剧本?电影题材有那么多种,这100多部剧本,你们是按什么原则挑选?

雷鸣:为了让机器理解剧本,我们会让懂剧本的人从内在冲突、外在冲突、主人翁的确立、剧情矛盾性等几个方向“教”机器读剧本。这也是跟电影学院的专业学生在分析剧本时是一样的角度。也就是说,机器在读剧本之前,肯定是人先去打标签。目前我们已经设定了大概22个维度让机器分析。

虽然让机器读懂并筛选剧本是件很难的事情,但在北美,这件事情已经做了至少10年。

另外,挑出的100多部用于训练的剧本,虽然类型很多,但像低成本的悬疑类、惊悚类我们一般不太考虑,这也就一定程度上降低了因类型过多导致的分析难度。

挑演员?选剧本?大数据说了到底算不算

  刘鹏 猫眼电影大数据中心高级经理

刘鹏:机器读懂剧本后,如何对电影进行票房预测?你们从哪几个维度进行数据分析?

雷鸣:在我们的数据模型里,电影的类型和剧本决定票房成功的概率是60%。机器在做票房预测的时候,会从三大方面进行分析,这也是我们主要研究的方向。

首先,是演员。在中国院线电影和网络电影市场上,演员是有票房号召力的。当剧本进入拍摄阶段,演员的上一部电影情况对这部电影的口碑和指数是会产生影响的。我们会用数据告诉制片方,这个演员在这种类型下表现的好不好,大家的预期会不会降低。

事实上,从近两年的数据监控上看,明星对院线电影票房影响最大的时间节点是上映首日,到第二天的时候,明星的大牌程度与票房关联度会降到32%左右。

第二,我们经常说到IP,IP对一部院线电影的整个影响其实也只在放映前三天,而且第三天就已经很弱了。

电影《中国合伙人》,因为有新东方这个大IP,又安排在暑期档,可是票房只在5000万左右,原因是中国社会对女性创业这件事情其实并不太关注。事实上,绝大部分国产片都是这样,即使有明星号召力,但票房就是上不去。

我们对2015年上映的每一部电影都用机器做了票房预测。在上映的7到10天内,准确率能达到64%。在这个过程中,购票网站的用户数据、市场数据都会被我们列入参考数据。因为我们自己的数据没那么多,所以也做了大量线下问卷。但如果可以和你们猫眼合作,那么我相信机器对票房预测的准确率还会上一个台阶。

第三,我们还会对观众进行研究。在做票房预测时,我们有16个“票仓人群”分析,基本会知道什么样的电影是什么样的人在看。而且,我们根据城市级别,对观影人群做了六个层次的数据分析,第一层和第二层是尝鲜的人群,他们看完电影之后没什么信息反馈,也没留下什么口碑,如果一部电影的观影情况是这种程度,很可能就会下线。

此外,我们还分析发现,三四线城市的观影人群很容易受题材和线下口碑影响。

挑演员?选剧本?大数据说了到底算不算

  吴晓 阿里数娱原创出品总监

吴晓:你们用机器阅读电影剧本并预测票房,那么对网络电影和网剧剧本有数据模型吗?

雷鸣:我们主要研究商业电影。在我看来,网络电影或者网剧首先要解决的不是内容好坏问题,而是要有基本的故事线。

我们都知道,优质的故事内容一定会对整个影视剧制作有帮助。但是反过来,中国真正开发院线电影和电视剧项目的人数远远不足,其中还有一部分人去做网剧,那么,我想这些人制作出来的内容可能并不会太好。

不过,在网络方面,我们今年开始做网络艺人的数据分析和融合。各种网红数据投放到模型上,得到的结果非常有意思。因为网剧和电影不一样,虽然受众范围小,但网剧明星的作用比院线电影明星大的多,而且在品牌端,哪些产品植入到哪类网剧中效果会更好,这也是机器特别难理解的事情。所以目前机器在这方面也只是尝试做分析。

挑演员?选剧本?大数据说了到底算不算

  刘倍贝 爱奇艺自制剧中心资深制片人

刘倍贝:我再来补充一点,网剧的观众主要以年轻人为主。所以网剧更注重标题入口,也许一张海报就能体现它的营销思路,看出来是不是具有吸引力。而且网剧的制作前期,会用很长时间做营销铺垫,即使热搜的关键词不那么清晰、明确,也可以通过前期宣传片、概念片,包括核心宣传的价值点,逐步吸引观众来看。所以从这些角度看,我觉得机器更适合分析网剧。

雷鸣:我们也发现了这个问题。事实上,对机器来讲,网剧的题材、片名,都更容易作为流量入口。我们希望通过数据挖掘,能知道每一种垂直人群他们感兴趣的点是什么,什么样的题材和标签是具有吸引性的,这样就能更好的让机器分析。总之,我们想利用机器解决中国影视制作行业内容方面的问题。

而通过这几年的研究我们发现,大数据实际上解决了影视制作的三大问题。第一,项目开发,也就是剧本选择问题,这也是中国院线电影的制作瓶颈;第二,艺人问题。我们经常见到,在影视立项过程中,挑选了很久的演员结果要么因为档期来不了,要么就是来了之后发现角色根本不合适,所以分析演员是很有必要的;第三,优质项目和优质资源的匹配问题。

The end

后记:

人工智能是大数据技术发展的未来,试想阿尔法狗都战胜了李世石,机器读懂剧本又有什么不可能?

虽然我们此次的巅峰思享会已经结束,但行业内对影视大数据的研究与探讨还远没有结束。无论什么样的研究,大家的目标都是一致的,那就是为观众提供更娱乐化、更个性化的内容,真正将中国电影电视剧打造成能满足观众需求的优质产品。

大数据已经慢慢渗透到各行各业,距离我们的生活已经不再是咫尺天涯,以后数据猿还会与更多行业的人士一起探讨大数据的应用与发展方向。敬请期待吧!





====================================分割线================================


本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
4天前
|
分布式计算 大数据 BI
MaxCompute产品使用合集之MaxCompute项目的数据是否可以被接入到阿里云的Quick BI中
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
4天前
|
SQL 分布式计算 大数据
MaxCompute产品使用合集之怎样可以将大数据计算MaxCompute表的数据可以导出为本地文件
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
4天前
|
分布式计算 DataWorks 关系型数据库
MaxCompute产品使用合集之可以使用什么方法将MySQL的数据实时同步到MaxCompute
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
4天前
|
分布式计算 DataWorks 数据库
DataWorks操作报错合集之DataWorks使用数据集成整库全增量同步oceanbase数据到odps的时候,遇到报错,该怎么处理
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
25 0
|
4天前
|
分布式计算 DataWorks 关系型数据库
DataWorks产品使用合集之在 DataWorks 中,使用Oracle作为数据源进行数据映射和查询,如何更改数据源为MaxCompute或其他类型
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
32 1
|
4天前
|
分布式计算 DataWorks 调度
DataWorks产品使用合集之在DataWorks中,查看ODPS表的OSS对象如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
29 1
|
4天前
|
分布式计算 DataWorks MaxCompute
DataWorks产品使用合集之在DataWorks中,将数据集成功能将AnalyticDB for MySQL中的数据实时同步到MaxCompute中如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
26 0
|
4天前
|
分布式计算 DataWorks 关系型数据库
DataWorks产品使用合集之在DataWorks中,MaxCompute创建外部表,MaxCompute和DataWorks的数据一直保持一致如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
21 0
DataWorks产品使用合集之在DataWorks中,MaxCompute创建外部表,MaxCompute和DataWorks的数据一直保持一致如何解决
|
4天前
|
分布式计算 DataWorks 安全
DataWorks产品使用合集之在DataWorks中,从Elasticsearch同步数据到ODPS时同步_id字段的如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
27 0

热门文章

最新文章