开发者社区> 小旋风柴进> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

爱奇艺:视频大数据的挖掘还不到1%

简介:         下文内容源于爱奇艺公司运营副总裁耿晓华的演讲。         跟大家分享一个数据,爱奇艺在移动端布局是比较早的,我们在2011年开始就预测什么时候移动端流量会超过PC端。我们原来有一个预测是在2013年的年底,但是经过实际的运营,其实在2013年的9月2日那一天移动端的流量完全超过了PC端,而移动端的增长速度远远比PC快,所以未来移动终端潜力是非常大的。
+关注继续查看
0.jpg

        下文内容源于爱奇艺公司运营副总裁耿晓华的演讲。

        跟大家分享一个数据,爱奇艺在移动端布局是比较早的,我们在2011年开始就预测什么时候移动端流量会超过PC端。我们原来有一个预测是在2013年的年底,但是经过实际的运营,其实在2013年的9月2日那一天移动端的流量完全超过了PC端,而移动端的增长速度远远比PC快,所以未来移动终端潜力是非常大的。

       大数据最重要的价值是预测

  对于移动端我们要看到现在手机在改变我们什么,我想在座各位每个人都可以想一想,现在我们看手机的频次是什么样,我基本上5分钟之内一定会看一下手机。因为你的碎片化时间,还有对于手机的使用频次,现在手机如果只是纯打电话这种工具已经很弱了,我们更多的拿手机当作获取信息的一个渠道。

  整个互联网每天产生的数据量大概是一个什么样?我这儿有一组数据,我们每一天可以发出2940亿封Email,可以在推特上产生340亿条信息,可以克隆1.68亿张DVD。这些都在说明,现在产生的数据非常庞大。在这些庞大的数据里面我们怎么样去挖掘,这些数据能够为我们做什么。现在这些数据的特点是规模非常大,处理速度要求越来越快,而且数据的类型非常多。大数据时代并不是要求现在我们像以前那样,在抽样样本的研究时代,我们可能对于数据的精准性会非常在意,而在大数据时代我觉得数据的精准性是可以忽略的。因为从大数据里面观察出的趋向和趋势是我们要研究整个数据能代表的含义的价值。所以对于数据的分析,最后我们是希望能够产生高价值的预测,大数据最大的最重要的一个一个价值是在于预测。

  大数据让用户服务更精确

  对于爱奇艺和PPS,(爱奇艺2013年的4月份收购了PPS),在这个平台上面,这(幻灯片展示的)只是一些基础数据,在PC端产生用户3.5亿,移动端用户2个亿,我们整个的12亿小时的内容、2亿的注册用户和1.33亿小时的移动端播放。大数据能够做什么呢?

  对于传统行业来讲,沃尔玛是最早利用大数据来做分析做经营预测,而且是做得非常优秀的。沃尔玛会通过连接上facebook和推特上反馈的一些数据。在美国经常会有飓风,当飓风来的时候他们会发现,从销量数据分析蛋挞和飓风用品摆在一起的时候销量都会上升,沃尔玛在经营上的堆积摆放都是来自于大数据的挖掘。

  而在互联网上对数据做得研究最深刻的应该是谷歌。对于流感预测,谷歌曾经通过搜索的数据,同时针对用户搜索的数据的词汇里面,从上千个词汇里面去找跟流感匹配的词汇,他们找到了83个精准的词汇。他们通过数据能够预测到在什么地方会发生流感,它甚至比美国的卫生监督机构获得的信息会更快更准确更早。

  对于数据,我们最终是希望它能够在商业化应用中发挥重要的力量,一个很简单的例子,这是2013年一部台湾剧叫《两个爸爸》。传统的片方在推这部剧的时候会告诉我们,这个剧用户大概是24到35岁之间,而通过百度用户的搜索以及爱奇艺的播放,我们对于用户播放的精准,能够精准到他最近搜过什么东西,上过什么网站,他最近有什么需求,通过这些数据分析,我给他更准确更精准的营销。对于大数据在互联网上,其实就是从原来对人群的标签变为对个人的标签,为用户打上标签之后对于用户提供的个性化服务就更精准更有价值,那我们媒体的价值会体现出来。

  在我们周围有Ipad、PC包括现在出租车上视频的播放,未来包括手表、微波炉、冰箱等都会有一个屏,同时这个屏的处理速度也会越来越快。在这个时候我们就要考虑,既然用户被这么多屏在包围,我们什么样的内容能够占据用户更多的时间,这就是媒体核心价值所在。这里有一个不同屏的行为数据,在上下班,移动端一定是最核心的,最便捷的用户获取信息和获得观看视频的工具。这是移动取代了PC成为每天上网的起点,很多用户都是早上起来之后,可能先把手机拿出来看一看,上一下微信、微博,然后看有哪些消息发生,最后又快速的看,或者扔到房间睡觉。大多数人的习惯可能都是越来越多的在利用移动端来获取信息,而 PC则更多的是一个工作工具。

  大数据下的视频机会

  接下来我说一下对视频而言,我们对于大数据到来可能存在哪些机会。这个《纸牌屋》我相信大家非常熟悉了,《纸牌屋》是2013年推出的美剧,在美剧的创造开始的时候,通过分析了三千万人流用户的留言以及分析,首先题材上选用了政治背景,因为他认为付费用户对这个题材会非常感兴趣。然后它的导演跟演员也通过数据挖掘和数据分析出来的,它是集凯文史派西、大卫芬奇、BBC出品三种元素于一体的电视节目,这样可能有更好的收视。

  而对这部电视剧营销、策划以及推广,包括上线之后对用户的分析都非常极致,它主要是利用这些数据,对这些数据营销做更好的挖掘。《纸牌屋》尽管在宣传上很多的是利用了大数据挖掘,但是我觉得也不尽然。这部剧的成功是多方面的,它的营销手段,包括它在制作的时候用的大牌的好莱坞的导演,而凯文在前三集之后由其他导演接替了。

  我们可以这么理解,在现在互联网这么发达的时代,一切都可以变为数据,当文字当创意这些都变为数据的时候,这些数据其实是可以为我们内容的创作、制作有一个在前期的一个保障,这比我们在没有任何数据的前提下去做创作,可能有这种数据基础更有价值。

  我也在这里说一下,爱奇艺在2014年也会大力推广我们的自制剧,包括自制综艺节目。去年爱奇艺做的汉字英雄以及现在正在热播的《人生需要揭穿》,对这些剧在整个制作之前,我们也是做了很多的数据分析和数据挖掘。第二点,在视频网站,它最大的特点是有海量的信息。用户在找自己内容的时候有两个渠道,这两个渠道一个是搜索,搜索的习惯我想我们都喜欢,浏览信息实在是太多了,另外一个就是推荐,对于推荐来讲有很多种推荐,其中我觉得利用大数据做的很多、做得最极致的个性化的推荐,是把用户的行为变成数据。我们现在每天在爱奇艺和PPS上产生的数据非常庞大,这些数据我们挖掘的连1%都不到,我们有待去做更多的挖掘。对于用户行为的这种,比如说什么类型的用户在看什么类型的片子,或者把用户打上标签的时候,我跟你是一类人,在个性化的时候,把我们互相看的去做推广,你喜欢这个内容的机会就会高。当这一切都变成可以记录、可以分析、可以挖掘数据的时候,实际上会给用户带来非常多的方便。用户有一习惯搜索内容,他们通过观看行为分析,我们来提供给他。

     其实数据有很多,最终我们希望所有用数据的行为分析能够落在商业上。用户在这个平台上所产生的行为数据,沟通,都会变成我们分析的基础。当进行数据分析的时候,我们可以把这些们通过一些科学的分类方式,然后给他划分不同的群体,然后每个群体的人里面又有不同的个体。对于用户的性别、年龄、喜好以及他的意图,都会变成一个一个的数据,他是什么样的用户,他喜欢看什么样的电影等等。

  庞大的用户每一个人有不同的标签属性,不管我在内容应用也好,或者在做商业挖掘也好,相对于客户群体,我们会有更多的价值来挖掘。我举两个例子,一个是"一搜百应",背后是百度,我们跟百度的搜索,整个百度的搜索用户数据打通了,当用户在百度上搜索之后,他到爱奇艺之后,搜索行为会传到爱奇艺,实现了某种沟通的方式。他目标人群搜的这些东西给他提供的是针对于他感兴趣的一些内容,不管是商业内容还是其他内容,我们整个数据是基于百度的数据和爱奇艺整体的数据来做的分析。

  我们还有一个项目是"蒲公英"项目,针对百度用户每天的上亿次搜索,尤其搜索之后,对于有很多内容可能是非常热销的内容,比如说像ISO、韩国的明星很多人在搜。现在热播的电视剧在搜,还有很多搜索,很多没有热播,但是客户在搜,希望有一个精准的解决方案,对这个来说我们就有"蒲公英"的项目,会提供精准的内容。

  关于电视互联网的未来,其实互联网挡是挡不住的,我们要用一个什么样的心态,要拥抱这种新的变化,因为大的时代不是属于互联网,是属于全人类的。


原文发布时间为:2014-01-21


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
大厂技术实现 | 爱奇艺短视频推荐业务中的多目标优化实践 @推荐与计算广告系列
短视频是当前互联网最热门的业务之一,聚集了巨大的互联网用户流量,也是各大公司争相发展的业务领域。作为主要营收业务方向,短视频方向的推荐算法也日新月异并驱动业务增长,本期我们看到的是爱奇艺的短视频频道下,推荐多任务算法应用实践路径与落地方案。
3905 0
AAAI 2020 | 速度提升200倍,爱奇艺&北航等提出基于耦合知识蒸馏的视频显著区域检测算法
2020 年 2 月 7 日-2 月 12 日,AAAI 2020 将于美国纽约举办。不久之前,大会官方公布了今年的论文收录信息:收到 8800 篇提交论文,评审了 7737 篇,接收 1591 篇,接收率 20.6%。本文介绍了爱奇艺与北航等机构合作的论文《Ultrafast Video Attention Prediction with Coupled Knowledge Distillation》。
20 0
2018年5月大数据ACP考试题目回顾
大数据 ACP 考试考试题目回顾 参数 任务调度时间为2017-10-2701:00:00,那么bdp.system.cyctim的结果为20171027010000 A. 是 B. 否 答案: A 解析: ${bdp.
7313 0
《大数据原理:复杂信息的准备、共享和分析》一一1.3 自动编码 格物致知。
本节书摘来自华章出版社《大数据原理:复杂信息的准备、共享和分析》一 书中的第1章,第1.3节,作者:[美] 朱尔斯 J. 伯曼(Jules J. Berman)著 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1034 0
《R语言数据挖掘》----第1章 预备知识 1.1大数据
第1章 预备知识 本章中,你将学习基本的数据挖掘术语,比如数据定义、预处理等。 最重要的数据挖掘算法将通过R语言进行说明,以便帮助你快速掌握原理,包括但不局限于分类、聚类和异常值检测。在深入研究数据挖掘之前,我们来看一看将要介绍的主题: 数据挖掘 社交网络挖掘 文本挖掘 网络数据挖掘
1173 0
【H.264/AVC视频编解码技术详解】一. 视频信息与压缩编码
《H.264/AVC视频编解码技术详解》视频教程已经在“CSDN学院”上线,视频中详述了H.264的背景、标准协议和实现,并通过一个实战工程的形式对H.
1898 0
2709
文章
6591
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载