影视业里的大数据应用,是噱头?

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 虽然不是完全同意文中看法,但作为反向观点,供大家借鉴思考。    近几年,有很多关于大数据在影视方面的案例,Netflix 这个词估计让大家耳朵都听起茧了,另外英国的一家做剧本语义分析的公司Epagogix也成为一个小热词。

虽然不是完全同意文中看法,但作为反向观点,供大家借鉴思考。

 

 近几年,有很多关于大数据在影视方面的案例,Netflix 这个词估计让大家耳朵都听起茧了,另外英国的一家做剧本语义分析的公司Epagogix也成为一个小热词。神秘的大数据与神秘的影视行业,结合在一起之后,便镀上了玄学色彩,似乎你今天在社交媒体上打个喷嚏,正在担心自己是不是感冒了,我明天就能做出一部禽流感主题的恐怖片,并让你有不得不去看的冲动。

事实上在视频行业的人都知道,所谓《纸牌屋》式的成功,与其当做一个技术发展案例来分析,不如将它作为一个公关案例来学习。原本在华纳工作的CMO Kelly Bennett 和来自迪斯尼的CCO Jonathan Friedland 通过《纸牌屋》这一事件让Netflix 变得更像一个电视台,而不是互联网企业,这其实是让Netflix 的想象空间变大了,因为互联网已经有了一家YouTube,但是还没有一家HBO 或者Showtime 。

至于将大卫·芬奇、凯文·史派西,以及1990年的《纸牌屋》组合在一起,可以产生奇妙的化学反应,这种充满诱惑的想法一看便知是好莱坞经纪公司的手段,而不是属于大数据的语言体系。

在《纸牌屋》的背后,大卫·芬奇和凯文·史派西同属一家经纪公司,这部电视剧的主要推手,是好莱坞的影子幕僚之一CAA 以及制作方MRC ,Netflix能够加入只是因为他们比有线电视台出钱更多。大数据在整部剧集中的作用,不会比在2008年将英剧《纸牌屋》推荐给MRC 联席董事长Modi Wiczyk 的那个实习生,所产生的价值更大。

至于Epagogix 所提供的服务也并不新鲜,好莱坞有上千名剧本医生,又便宜又好用。20世纪80年代之后,好莱坞的观众结构和观影偏好逐渐趋于稳定,对观众喜好的判断并不是个难题,目前在北美普遍采用的焦点访谈形式,所能获得的反馈也要更为具体和实用。

从某个角度来说,好莱坞并不缺少好创意和好剧本,将文字转换成影像的过程,所存在的不可控要比一些娱乐报道中的公开信息复杂的多。如果单纯基于剧本和演职员搭配的角度,就可以预测未来高枕无忧,就好比我们是通过分析母鸡的体格,然后去判断一盘西红柿炒鸡蛋的受欢迎程度,它们二者之间必然相互关联,但是这种相关性不足以用来证明一名以泡面为生的宅男,为何会顿时爱上为他炒鸡蛋的MM。


大数据为何近几年大热?

人类进入大数据时代,类似于生物学迎来了显微镜,天文学发现了望远镜,因为网络传输和计算机存储运算能力的提高,交给了我们一把信息放大镜,从此我们对现象的观察进入一个新的领域。

其实自古就有多维度数据的挖掘行为,历法的制定过程或许可以作为一个很好的例证,江湖上现在偶尔也会有关于林元帅诸葛军师的传说,自从计算机技术诞生之后,对数据的利用和处理一直在同步发展中,无论是分布处理还是并行处理,并不是一天就蹦跶到今日的技术高度,我们很多科学发现都是在近三十年之间才完成,正是得益于此。

但为何在这几年“大数据”忽然大热?原因其实很简单,全球智能手机的普及。随着移动终端信息处理能力的提升,与用户的交互界面不仅更加具备黏性,并且实现了全方位全时段互动,此时每个人的移动终端实际上就变成了一个数据记录仪。它比PC所能获取到的信息更加个人化,不仅暴露这个人的生活细节,位置动向,同时也记录着他的消费习惯,人类第一次拥有了这么多数据的生产者。每一个元数据都可以直接挂钩一份具体的支出额度,每一个数字都可以被货币量化,大数据的商业价值与各个企业的营收几乎都可以直接挂钩。所以,围绕“大数据”来说故事迅速成为当下的主流。

但是揭开媒体的那些噱头背后,你会发现,国内对复杂系统的研究,仍然是处于概念大于应用的阶段,大部分行业对线性、封闭系统内的数据关系都没办法掌握,更不用说将大数据转化成有价值的信息。而在影视行业,工业化体系处于刚刚起步的阶段,很多从业人士连财务报表这种基础数据都看不明白,去理解大数据的价值更是有些不可想象了。

大数据于国内影视行业的意义

大数据技术作为一种工具,其应用方向,无非三个方面,一是对过于和曾经的理解,二是对以后和将来的认知,三是对当下进行判断并进行实时处理,影视行业大数据技术的应用如果想要有长足的发展,那么在这三个方面都会面临着一些需要解决的问题。

 

对过去和曾经的理解

既然是对已发生的进行判断,就会涉及到数据采集,这个部分往往会引发争论,中心议题是:到底多大才叫大,GB还是TB,PB还是EB?

如果我想要知道《致我们终将逝去的青春》这部差一点就可以归类到文艺片的电影,为什么在2013年上半年票房仅次于《西游·降魔篇》,我是应该仅以社交媒体的传播效率来进行数据的挖掘,还是要追溯到原著小说里的青春以及被电影宣传所唤起的记忆?

将数据挖掘的范围放在社交媒体的范畴,那么通过对一部电影推广过程的梳理,我们很容易通过数据制定出一张细化到分钟的参考,以及观众会被什么样的宣传内容所吸引,但是它仍然只是在描述表象。

如果观察只停留在眼前,将无法找到最终的因果。我们必须对推动现象发生的机制进行论证,那么我们该用什么样的体量来储存和分析观众们的记忆,从而找到个人经历和集体共鸣之间的关系?

在这个方面,如果只用社交媒体的数据进行相关性的分析,其实和我们日常所做的感性推导没有太大区别,甚至还不如感性推导灵活,很容易因为数据的不够全面犯下“黑天鹅”式的错误(在发现澳大利亚之前,西方认为只有白天鹅)。必须要追溯到成因阶段更庞大的外部数据,比如主要观众群十年间的消费偏好及社会经历,以及对他们观影之前的心理活动进行统计分析。会不会太复杂?但是从数据挖掘的角度来说,只有在这个方向上进行努力才可能会提供实质性的价值。

或者说,我们也可以简单粗犷一些,如麦特的负责人陈砺志所言,《致青春》的成功最主要的因素是因为赵薇的敬业与投入,以及她个人在行业的积累。

大家可以想一想,以上三个角度,哪个会更容易接近整个事件的核心。

 

对以后和将来的认知

大数据技术虽然可以让人类对现象的理解进行更深入的探究,但是当对国产的影视项目前景进行预测,首先需要面对的问题是,我们仍然处于一个观众群体持续波动的时期。

在北美市场,贡献50%票房的观众约占人口的10%,也就是3000万左右,这部分群体基本上结构相当稳定。上世纪70年代末,当北美电影的平均制作预算开始攀升到1000万美元以上,宣发费用达到500万以上时,对观众的监测从阶段性的调研逐渐转变成常态性的监控。在计算机还只是个神话的时期,“好莱坞”是用人工+信件的形式,建立了最早的大范围观众研究模型,这些历史数据通过几十年的积累,已经让一部电影与观众之间的联系变得非常透明。但即使是如此严谨的市场监控,近几年也因为受到移动互联的影响,观众去影院观影的行为随机性逐渐提高,导致传统的观众研究模型频频出现一些问题。

 

反观国内电影市场,差不多有三分之二的银幕是在近三年之内才出现的2010年时,我们所拥有的现代化银幕不过才6223块,而如今,这个数字差不多是17000。可想而知,影院目前所迎来的观众,基本上是近三年才开始逐渐培养去影院观影的兴趣,这种行为暂时还不能称之为习惯。

所以说,中国电影市场目前的波动很难通过现有的技术手段完成监测,会因为存在有其他我们不可知的变量,而导致结果南辕北辙,这在统计学的回归分析上被称之为“变量遗漏偏差”,大数据技术目前所能覆盖到的范围并不能帮我们解决这个问题。我们还需要时间来不断修正对市场数据的理解,观众也需要时间来不断培养在影院观影的习惯。

2013年上半年,几乎所有从业者都对有动作元素的电影过于乐观,而下半年,所有从业者包括我个人又会对以爱情元素为主的电影过分看好。从一些公司的大数据监测上来看,这种观众消费行为的变化已经反馈在可以被抓取的数据中,但是我们并不知道它所形成影响究竟该如何定量。也就是说我们可以看到趋势,但是很难确定结果。

那么,在如今的中国电影市场中,我们不如将大数据技术的应用方向,从对未来的预知上转移到可以让我们规避哪些操作上的错误,或许更具有现实意义。

对当下进行判断并进行实时处理

现在对大数据的理解,往往会纠缠于第一个字“大”,而忽视了它的另外一个重要特征“细”,其实后者才是最重要的,因为它会创造大数据真正的实用价值。

基于社交媒体的数据挖掘,其实已经可以做到让我们将观众的分类从简单的年龄、性别、职业等维度,落实到区域、活动空间以及性格特征等等更为丰富的细节,在这样的基础上,我们要做的就是怎样给观众提供个性化的影响,而不再是以电影为本位的共性宣传。

举例来说,当一名男性观众在某个媒介上看到的电影海报,可能是大长腿和小翘臀,但一个女性观众同时接触这个媒介时,所看到的可能是一个卖萌的大叔。当阵地宣传中的预告片贴片到一部好莱坞大片之前时,它可能主要是用来渲染情感或者突出搞笑,但同样的一分多钟,在视频网站所上线的预告片,则被分成数个版本,用来对应每一个点击背后用户的个人资料。这样,观众便会加入到生产的过程中,通过对观众偏好的快速处理,最终创造更适合于传播的信息。

目前,数据调研公司参与电影推广的过程,所做的仍然只是一个统计的工作,决策是在片方或者是公关公司,其实可以将决策机制与数据同样进行细化,成为实时的互动,减少时间的损耗,提高电影推广的效率。我们以前在电影的推广中,常常会为如何照顾到大部分观众的兴趣而头疼,那么换一种思路,用现有的观众数据进行群体的细分,给不同的观众群提供不一样的信息,海纳百川比光芒四射或许更符合当下社会化营销的要义。

 

不过,这一切其实都只是理想化的愿景,现实的情况是,中国的电影产业目前仍然是处于一个极其原始的状态。


仅从电影投资成本的角度来说,目前所公映的电影,平均投资约在3000万人民币以内,不足500万美元,这样的投资规模在不考虑通胀以及观众收入的情况下,只相当于北美70年代初期的水平。面对这样的市场环境,很多议题其实都显得比较空洞,因为拍脑袋做决策虽然有着莫大的风险,但毕竟成本很低。


原文发布时间为:2013-10-25


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
27天前
|
SQL 存储 分布式计算
ODPS技术架构深度剖析与实战指南——从零开始掌握阿里巴巴大数据处理平台的核心要义与应用技巧
【10月更文挑战第9天】ODPS是阿里巴巴推出的大数据处理平台,支持海量数据的存储与计算,适用于数据仓库、数据挖掘等场景。其核心组件涵盖数据存储、计算引擎、任务调度、资源管理和用户界面,确保数据处理的稳定、安全与高效。通过创建项目、上传数据、编写SQL或MapReduce程序,用户可轻松完成复杂的数据处理任务。示例展示了如何使用ODPS SQL查询每个用户的最早登录时间。
81 1
|
1月前
|
存储 分布式计算 druid
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
52 1
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
ly~
|
1月前
|
供应链 搜索推荐 安全
大数据模型的应用
大数据模型在多个领域均有广泛应用。在金融领域,它可用于风险评估与预测、智能营销及反欺诈检测,助力金融机构做出更加精准的决策;在医疗领域,大数据模型能够协助疾病诊断与预测、优化医疗资源管理和加速药物研发;在交通领域,该技术有助于交通流量预测、智能交通管理和物流管理,从而提升整体交通效率;电商领域则借助大数据模型实现商品推荐、库存管理和价格优化,增强用户体验与企业效益;此外,在能源和制造业中,大数据模型的应用范围涵盖从需求预测到设备故障预测等多个方面,全面推动了行业的智能化转型与升级。
ly~
72 2
ly~
|
1月前
|
供应链 搜索推荐 大数据
大数据在零售业中的应用
在零售业中,大数据通过分析顾客的购买记录、在线浏览习惯等数据,帮助零售商理解顾客行为并提供个性化服务。例如,分析网站点击路径以了解顾客兴趣,并利用历史购买数据开发智能推荐系统,提升销售和顾客满意度。此外,大数据还能优化库存管理,通过分析销售数据和市场需求,更准确地预测需求,减少库存积压和缺货现象,提高资金流动性。
ly~
226 2
ly~
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
大数据在智慧金融中的应用
在智能算法交易中,深度学习揭示价格波动的复杂动力学,强化学习依据市场反馈优化策略,助力投资者获取阿尔法收益。智能监管合规利用自然语言处理精准解读法规,实时追踪监管变化,确保机构紧跟政策。大数据分析监控交易,预警潜在违规行为,变被动防御为主动预防。数智化营销通过多维度数据分析,构建细致客户画像,提供个性化产品推荐。智慧客服借助 AI 技术提升服务质量,增强客户满意度。
ly~
100 2
ly~
|
1月前
|
供应链 监控 搜索推荐
大数据的应用场景
大数据在众多行业中的应用场景广泛,涵盖金融、零售、医疗保健、交通物流、制造、能源、政府公共服务及教育等领域。在金融行业,大数据用于风险评估、精准营销、反欺诈以及决策支持;零售业则应用于商品推荐、供应链管理和门店运营优化等;医疗保健领域利用大数据进行疾病预测、辅助诊断和医疗质量评估;交通物流业通过大数据优化物流配送、交通管理和运输安全;制造业则在生产过程优化、设备维护和供应链协同方面受益;能源行业运用大数据提升智能电网管理和能源勘探效率;政府和公共服务部门借助大数据改善城市管理、政务服务及公共安全;教育行业通过大数据实现个性化学习和资源优化配置;体育娱乐业则利用大数据提升赛事分析和娱乐制作水平。
ly~
302 2
|
2月前
|
存储 数据可视化 大数据
大数据管理与应用
大数据管理与应用是一门融合数学、统计学和计算机科学的新兴专业,涵盖数据采集、存储、处理、分析及应用,旨在帮助企业高效决策和提升竞争力。核心课程包括数据库原理、数据挖掘、大数据分析技术等,覆盖数据处理全流程。毕业生可从事数据分析、大数据开发、数据管理等岗位,广泛应用于企业、金融及互联网领域。随着数字化转型加速,该专业需求旺盛,前景广阔。
123 5
|
2月前
|
存储 搜索推荐 大数据
大数据在医疗领域的应用
大数据在医疗领域有广泛应用,包括电子病历的数字化管理和共享,提升医疗服务效率与协同性;通过数据分析支持医疗决策,制定个性化治疗方案;预测疾病风险并提供预防措施;在精准医疗中深度分析患者基因组信息,实现高效治疗;在药物研发中,加速疗效和副作用发现,提高临床试验效率。此外,在金融领域,大数据的“4V”特性助力业务决策前瞻性,被广泛应用于银行、证券和保险的风险评估、市场分析及个性化服务中,提升运营效率和客户满意度。
81 6
|
2月前
|
机器学习/深度学习 数据可视化 大数据
阿里云大数据的应用示例
阿里云大数据应用平台为企业提供高效数据处理与业务洞察工具,涵盖Quick BI、DataV及PAI等核心产品。DT203课程通过实践教学,帮助学员掌握数据可视化、报表设计及机器学习分析技能,提升数据驱动决策能力。Quick BI简化复杂数据分析,DataV打造震撼可视化大屏,PAI支持全面的数据挖掘与算法应用。课程面向CSP、ISV及数据工程师等专业人士,为期两天,结合面授与实验,助力企业加速数字化转型。完成课程后,学员将熟练使用阿里云工具进行数据处理与分析。[了解更多](https://edu.aliyun.com/training/DT203)
|
2月前
|
机器学习/深度学习 人工智能 分布式计算
人工智能与大数据的融合应用##
随着科技的快速发展,人工智能(AI)和大数据技术已经深刻地改变了我们的生活。本文将探讨人工智能与大数据的基本概念、发展历程及其在多个领域的融合应用。同时,还将讨论这些技术所带来的优势与挑战,并展望未来的发展趋势。希望通过这篇文章,读者能够对人工智能与大数据有更深入的理解,并思考其对未来社会的影响。 ##

热门文章

最新文章

下一篇
无影云桌面