去年AI当了回电影节作品编剧,现在MIT又训练它来预测观众泪点

简介:

虽然计算机在观看悲情电影时不会哭,但它却能预测我们的泪点。

 都是套路,麦肯锡与MIT研究出了能预测电影泪点的AI模型

在2016年伦敦科幻电影节上首次亮相的科幻微电影《Sunspring》(《阳春》),讲述了一个全民失业的反乌托邦国度,一经放映就吸引了大票粉丝,有观众评价它有趣却又怪诞,但也有很多观众反馈它的情节设计存在诸多不合理。

其实,这部影片最大的亮点就在于:它的编剧是人工智能(AI)。

看到这里,很多人可能又会感慨:“机器会不会取代人类编剧,就像无人驾驶汽车可能取代了人类司机一样?!”

其实,如前面所说,如果你细看这部影片,就会发现很多“穿帮”剧情。比如,片中某个角色咳嗽时眼球竟然掉了!还有有影评家指出:“片中的对话听起来像是不相关语句的拼凑”。不难看出,尽管科技不断进步,但人类编剧的地位却仍然不可动摇。

这里,我们来设想一个不太极端的场景:机器和人类是否有可能共同完成一个剧本?即由人类编剧负责撰写巧妙的转折和现实对话,AI则负责提供见解、增强故事的感染力,比如识别能触动观众的背景音乐或画面。

最近,麻省理工学院(MIT)媒体实验室对这种人机合作编剧的形式进行了研究,并从中确认机器能否识别影片中常见的情感曲线——人物命运的跌宕起伏,包括在困境中挣扎、克服困难、误入歧途、战胜邪恶势力等等。我们发现,不论是对于YouTube上的业余视频制作者,还是电影工作室制作人,只要涉及到剧情编写,都会考量这些问题。

因此,如果机器能做到这些,那么编剧是否可以借助这些信息来预测观众的反应,从而调整自己的剧本?答案是肯定的。

情感曲线:故事的灵魂

首先,我们先来谈谈情感曲线。

纵观整个文学领域,我们发现像桑达克、斯皮尔伯格、普鲁斯特和皮克斯这样的传奇作家,就非常善于拿捏和激发观众的情感,并通过观众的喜恶,适当调整故事情节,在关键的时刻唤起观众内心的快乐、伤感或愤怒。然而,就算是最优秀的作家,也无法确保故事情节的完美无缺,就连莎士比亚的某些戏剧也可能无法让观众产生共鸣(没有多少人喜欢他的《辛白林》)。

那么,是什么导致有些电影广受好评,有些却无人问津?对情感曲线的把握非常关键。

情感曲线这一概念由来已久,大师级作家都对它十分熟悉,有些人还会尝试找出其中的通用模式。举个例子,美国黑色幽默作家Kurt Vonnegut就认为最成功的情感曲线是《灰姑娘》的故事模式:在故事开头主人公灰姑娘身处困境,接着在仙女教母的帮助下扭转命运,其他难题也随之解决。

总结一下,即“苦难”的故事开头,但最终都有圆满的结局——王子和公主从此过上了幸福美满的生活。

毋庸置疑,故事的情感曲线往往会影响观众的参与度,包括观众在社交网络上的影评,以及是否将其推荐给其他朋友。据宾夕法尼亚大学对《纽约时报》的文章展开的研究发现,读者更乐意分享那些能引起强烈情感共鸣的故事,尤其是能唤起读者积极情绪的故事。由此可推测,电影观众也会有与读者相似的反馈方式。

来自MIT的一项基础实验:让机器成为电影观众

此前,佛蒙特大学开发了一种算法,即利用计算机扫描影片台词或剧本内容来构建情感曲线。

在此基础上,不久前MIT社会机器实验室又联合麦肯锡消费技术与媒体团队继续进行了深入研究,研发了基于深度神经网络的机器学习模型,用来观看影片、电视节目和网络短片中的细节特征,并实时评估其中包含的积极与消极情绪

这些模型的研究范围覆盖影片的所有元素,包括情节、角色、对话,及例如追车场景中的人脸特写或音乐片段等其他细节。通过将各部分组成一个整体,就形成了故事的情感曲线。

也就是说,当机器查看了未标记视频后,就能基于所有视听元素为故事创作出情感曲线。这是前所未见的。

以著名的3D动画电影《飞屋环游记》的片头为例,影片主角Carl Fredricksen是个脾气暴躁的小老头,在妻子Ellie去世后,他用数千个气球带着自己的房子飞向南美。为了更好展现Carl的探险旅程,编剧需要想出一个快速交代复杂背景故事的方法。

影片以一个无声的片段(只有背景音乐)为开头,随着Carl的生活场景徐徐展开,情感曲线也就出现了。(我们也观察了整部影片的情感曲线,但分段考查更能以小见大。)如下图:

 都是套路,麦肯锡与MIT研究出了能预测电影泪点的AI模型

图1:由机器算法所展现的电影《飞屋环游记》片头的情感曲线

从图中可以看到,影片中蒙太奇(在电影中指有意涵的时空人为的拼贴剪辑手法)的高低点,x轴是时间,以分钟为单位;y轴是视觉效价,即图像在特定时间唤起观众积极或消极情绪的程度。此处由机器打分,分数越高,情绪越积极。为开展全面分析,我们还用机器为完整影音建立了类似图表。不过重点在图像上,因为这也是接下来分析观众情感投入的研究重点。

在图中,视觉效价的分值为0到1,但并非每部电影的情感曲线都会跨域整个区间。重点在于相对效价,即某个场景与其他场景相比之下的积极或消极程度,以及情感曲线的整体形状。

和其他影片一样,《飞屋环游记》片头的蒙太奇片段中也有系列情绪波动,因此其情感曲线并非连续上升或下降。例如,Carl在儿时探险时,曲线到达了峰值(carl儿时的探险经历中有很多美好快乐的回忆);而当年轻的Ellie半夜恐吓Carl时,曲线瞬间大幅下滑。Carl受到惊吓后,曲线呈现了消极走向。另外两处的峰值间隔较长,出现于Carl和Ellie婚后渴望孩子以及老两口深情相拥的片段。结尾处, Carl在Ellie 病逝后独自一人回到家中,情感效价骤降。

目前,MIT的机器学习模型已经分析了上千部影片,并为每部影片绘制了情感曲线。为检验其准确性,团队还招募了志愿者为各电影片段手动标注情感标签,同时,志愿者们通过注明唤起情感共鸣的影片元素,如对话、音乐或画面,还可以不断优化模型。

寻找共性:为情感曲线分类

通过对影片分析数据的筛选,我们开发了一套为影片故事分类的方法,即把情感曲线相同的影片归为一类。这个方法结合了聚类算法k-medoids与动态时间规整算法,从而检测两个不同情绪变化频率的视频序列之间的相似之处。

整个研究过程选取了两个不同的数据集,分别由500多部好莱坞电影和Vimeo网站上的1500个短片构成,并从中归纳情感曲线的类别。

在初步分析其视觉效价时,我们发现大多数影片可归纳为几种类别,结果与Kurt Vonnegut的猜想一致。

 都是套路,麦肯锡与MIT研究出了能预测电影泪点的AI模型

图2:不同类别影片的情感曲线

从上图中看到,Vimeo数据集中的情感曲线可分为五类。例如,标黄的曲线类型在视频前期消极情绪激增,此后直至接近尾声,始终维持积极情绪。(经机器对数据进行分析评分,所有影片开头和结尾处的效价值都会偏低。)

让计算机成为“水晶球”:预测观众的参与度

了解影片的情感走向诚然有趣,但明确如何使用这些分析结果更为重要。

影片的情感曲线或曲线类别能否决定观众的观影反应?包含特定情感曲线的影片能否激发观众的情绪?研究团队尝试通过分析Vimeo短片的数据集来回答以上问题。(相较于声音曲线,视觉曲线与影片内容的关联性更强,且结合两种曲线会增加分析难度,因此决定围绕视觉曲线展开分析。)

在保证影响在线反馈的元数据(如影片长度和上传日期)不变的前提下,我们运用了回归模型分析影片的情感曲线特征。

需要说明的是,本研究的目的是预测Twitter及其他社交媒体上影片的评论数。除去评论中的负面内容,多数情况下,评论越多说明观众反应越强烈。但也有例外,比如像Gigli和Ishtar(《鸳鸯绑匪》和《伊斯达》)这类电影,尽管能引发大量网评,却鲜有好评。

在分析Vimeo短片时,利用视觉曲线确实可以预测观众的参与度,其中几类影片更能吸引评论(为确保准确性,每次分析都会选择不同类别的电影)由分析可知,图2标红的曲线类型走势起起伏伏,早期充满成功和喜悦,后期逐渐陷入不幸。在所有类别中,此类影片结局最悲惨。但尽管如此,还是会给观众留下深刻印象。

除此之外,在针对Vimeo短片的其他分析中,还有一类影片的评论最多,远高于其他影片(见图3)。这类影片多以积极的情感爆发作为故事高潮,接近曲线尾端时走势激增。而图中这两类影片的主要区别在于左侧图中的故事在圆满结局前的情绪波动更大。

 都是套路,麦肯锡与MIT研究出了能预测电影泪点的AI模型

图3:两类评论最多的影片类型

相较于其他悲情结局的电影,上图这两种影片的评论更多,这一发现或许与宾夕法尼亚大学研究表明观众更喜爱大团圆结局的结果正好相反。

在此基础上,研究团队还浏览了Vimeo网上短片的所有评论,对情感倾向进行分类评分,然后运行程序统计了评论长度。分析结果表明,上述三类影片(即黄色、红色和蓝色线条)的评论更长,观众反应更强烈。评论不仅只有“好电影”几个字,还可见走心评论,如“太棒了……太震撼了……仿佛受到了重击。”还有些评论也很醒目,它们不局限于个别的视觉画面,还在意影片带来的整体感受,或影片的情节走向。

事实上,这些分析并非要让编剧按照特定模版撰写剧本,就像要求George Orwell为《1984》续写美满结局来博观众欢心一样。但它们可以激励编剧客观地审视剧本内容,并作出相应调整以引发观众共鸣,包括改变关键场景配乐或对情节、对话或角色等内容进行微调。

总的来看,随着AI的推广,影片制作过程也在发生改变,编剧和作家可以借助人工智能来打磨情节,增加故事的吸引力,而导演也可以借此在影片中设置更具冲击力的动作捕捉。越来越多的影视从业者开始逐渐意识到AI的价值,并利用其中的价值进行创作。







原文出处:科技行者
转载请与作者联系,同时请务必标明文章原始出处和原文链接及本声明。
目录
相关文章
|
5天前
|
机器学习/深度学习 人工智能 算法
UCLA、MIT数学家推翻39年经典数学猜想!AI证明卡在99.99%,人类最终证伪
近日,加州大学洛杉矶分校和麻省理工学院的数学家团队成功推翻了存在39年的“上下铺猜想”(Bunkbed Conjecture),该猜想由1985年提出,涉及图论中顶点路径问题。尽管AI在研究中发挥了重要作用,但最终未能完成证明。人类数学家通过深入分析与创新思维,找到了推翻猜想的关键证据,展示了人类智慧在数学证明中的不可替代性。成果发表于arXiv,引发了关于AI在数学领域作用的广泛讨论。
116 89
|
1天前
|
人工智能 物联网
AI电影从这个LoRA开始:魔搭AIGC1月赛题公布&12月赛题获奖作品新鲜出炉
魔搭社区LoRA创意挑战赛月度赛第三期来啦! 1月赛题揭晓:电影风格模型训练大赛
|
28天前
|
机器学习/深度学习 存储 人工智能
【AI系统】感知量化训练 QAT
本文介绍感知量化训练(QAT)流程,旨在减少神经网络从FP32量化至INT8时的精度损失。通过在模型中插入伪量化节点(FakeQuant)模拟量化误差,并在训练中最小化这些误差,使模型适应量化环境。文章还探讨了伪量化节点的作用、正向与反向传播处理、TensorRT中的QAT模型高效推理,以及QAT与PTQ的对比,提供了实践技巧,如从良好校准的PTQ模型开始、采用余弦退火学习率计划等。
77 2
【AI系统】感知量化训练 QAT
|
28天前
|
机器学习/深度学习 存储 人工智能
【AI系统】训练后量化与部署
本文详细介绍了训练后量化技术,涵盖动态和静态量化方法,旨在将模型权重和激活从浮点数转换为整数,以优化模型大小和推理速度。通过KL散度等校准方法和量化粒度控制,文章探讨了如何平衡模型精度与性能,同时提供了端侧量化推理部署的具体实现步骤和技术技巧。
44 1
【AI系统】训练后量化与部署
|
6天前
|
人工智能 智能硬件
SPAR:智谱 AI 推出自我博弈训练框架,基于生成者和完善者两个角色的互动,提升了执行准确度和自我完善能力
SPAR 是智谱团队推出的自我博弈训练框架,旨在提升大型语言模型在指令遵循方面的能力,通过生成者和完善者的互动以及树搜索技术优化模型响应。
19 0
SPAR:智谱 AI 推出自我博弈训练框架,基于生成者和完善者两个角色的互动,提升了执行准确度和自我完善能力
|
24天前
|
人工智能 数据挖掘
AI长脑子了?LLM惊现人类脑叶结构并有数学代码分区,MIT大牛新作震惊学界!
麻省理工学院的一项新研究揭示了大型语言模型(LLM)内部概念空间的几何结构,与人脑类似。研究通过分析稀疏自编码器生成的高维向量,发现了概念空间在原子、大脑和星系三个层次上的独特结构,为理解LLM的内部机制提供了新视角。论文地址:https://arxiv.org/abs/2410.19750
67 12
|
26天前
|
人工智能 PyTorch 测试技术
【AI系统】并行训练基本介绍
分布式训练通过将任务分配至多个节点,显著提升模型训练效率与精度。本文聚焦PyTorch2.0中的分布式训练技术,涵盖数据并行、模型并行及混合并行等策略,以及DDP、RPC等核心组件的应用,旨在帮助开发者针对不同场景选择最合适的训练方式,实现高效的大模型训练。
61 8
|
2月前
|
人工智能 知识图谱
成熟的AI要学会自己搞研究!MIT推出科研特工
MIT推出科研特工SciAgents,结合生成式AI、本体表示和多代理建模,实现科学发现的自动化。通过大规模知识图谱和多代理系统,SciAgents能探索新领域、识别复杂模式,加速新材料发现,展现跨学科创新潜力。
47 12
|
2月前
|
机器学习/深度学习 人工智能 搜索推荐
AI与娱乐产业:电影制作的新工具
随着科技的发展,人工智能(AI)逐渐渗透到电影制作中,带来了前所未有的创新。本文探讨了AI在剧本创作、场景构建、特效制作、动作捕捉、音频处理、剪辑及市场调研等领域的应用,以及其对提升效率、激发创意和拓宽视野的影响,展望了AI在未来电影产业中的重要作用。
|
2月前
|
机器学习/深度学习 存储 人工智能
【AI系统】谷歌 TPU v2 训练芯片
2017年,谷歌推出TPU v2,专为神经网络训练设计,标志着从推理转向训练的重大转变。TPU v2引入多项创新,包括Vector Memory、Vector Unit、MXU及HBM内存,以应对训练中数据并行、计算复杂度高等挑战。其高效互联技术构建了TPU v2超级计算机,显著提升大规模模型训练的效率和性能。
49 0