中传影视王鑫:大数据在传媒领域的应用

简介:
随着社会的不断发展,数据分析的价值越发凸显。洞悉本质,预测未来,是人类追寻的永恒真理,也是数据分析的价值所在。2017年5月10日,由中国新一代IT产业推进联盟主办,CIO时代APP承办的"第57期CIO时代信息化大讲堂"活动在北京大学燕园大厦如期举行。  

中国传媒大学信息工程学院副教授、兼任中传影视大数据研究院技术负责人、中国商业联合会数据分析专业委员会特聘讲师王鑫作为本期活动的特邀讲师,发表了题为《大数据在传媒领域的应用》的主题演讲。

  他主要从数据和大数据的定义、怎么使用数据、数据的应用领域三大方面展开详细阐述。  

数据的发展   

从远古时代开始,人类就开始对自然界的事物以及自身的活动进行测量和记录。因此,可以说人类社会时时刻刻都在产生数据。只是随着社会的发展和技术的进步,人们需要并且能够记录和分析更多的数据。直到2014年1月25日,央视《晚间新闻》“据说春运”特别节目首次播出后,观众们对这种运用数据可视化技术来播新闻的新颖方式非常感兴趣。在技术进步和用户需求双轮驱动下,大数据的列车已滚滚而来。大数据将深深的影响我国的政治、经济、文化和社会各个层面。  

数据可视化工具和数据挖掘十大算法   

数据可视化工具包括EXCEL、Tableau、D3、R语言、Gephi、NodeXL等等,数据挖掘十大算法包括用于统计学习的SVM、EM工具,链接挖掘的PAGE RANK,袋装推进的AdaBoost,用于聚类的K-Means,用于分类的C4.5、KNM、CART、Naive Bayes,用于关联的Apriori。  

数据:将带来一场新的革命   

数据价值的凸显和数据获取手段、数据处理技术的改进是"大数据"爆发的根源。而随着数据生产要素化,数据科学、数据科技的不断发展和数据价值的深度挖掘及应用,一场大数据革命正在进行,它将带动国家战略及区域经济发展,智慧城市建设,企业转型升级,社会管理及个人工作、生活等各个领域的创新和变革。如何真正应用好大数据,发挥大数据的威力,是当前所有人都在共同研究和探索的问题。  

可视化技术行业应用   

1、新闻。主要应用于新闻舆情分析、新闻热点分析、新闻重大事件分析。  

2、电影。主要应用于电影剧本分析、电影营销分析、电影用户行为分析。  

3、广电。主要应用于用户行为分析、用户肖像刻画、广告精准投放、智能推荐系统。  

4、电视剧。主要应用于节目收视分析、节目流失分析、节目偏好分析。  

广电大数据 —分析   

1、在直播方面,数据分析包括收视时长、收视率、到达率、接触度、市场份额、观众忠诚度等。创新指标里的节目相对吸引力、收视率分布等。  

2、在点播方面,主要分析VOD业务使用及VOD节目指标以及各时段在线户数、在线率;到达户数、到达率、点播户数、点播率、收看时长、页面点击等。创新的竞争力指标里的时间转化率、点击转化率。按栏目、按供应商分别分析。  

3、在时移、回看方面,业务各时段在线户数、在线率、页面点击率等分析。各频道及节目的收视时长、收视率、到达户数、到达率、市场份额等数据分析。  

4、在广告业务方面,按各广告位、广告包进行指标分析,和各广告位曝光频次、n+曝光率、n+到达户数、有效曝光率、有效到达户数等。  

5、其它增值业务。数据分析包括业务各时段在线户数、在线率、页面点击率以及其它定制指标分析。  

广电大数据的特点   

1、数据准确、分析计算误差小;公正、抗污染、不易造假。全网海量用户收视数据分析,全方位、无死角,尤其对弱势频道、非黄金时段节目的数据分析更准确,使其数据有意义,更能反映实际情况;全网双向用户可达千万以上,用户污染影响微乎其微;  

2、指标更有价值。例如忠诚度、竞争力指标等,对低收视率的频道和节目,能提供更多参考依据;  

3、能提供舆情分析。根据全网用户的收视行为,结合节目播出信息,可以分析舆情;涉及舆情及国家信息安全,不建议外资公司参与;  

4、能了解每一个用户的偏好,提供个性化服务。  

5、技术难度大。采用传统手段采集海量用户收视数据,成本太高;采用终端数据回传,需要掌握嵌入式设备、计算机、网络相关的关键技术;全网收视数据是海量数据(以歌华为例,400万用户每天>2亿条),传统的数据库技术无法支撑,需掌握大数据处理系统的架构、算法、专业工具等核心技术;  

在提问环节中,他对到场的嘉宾所提的问题依次进行了详细的解答。他的讲解环环相扣,理论与实践兼备,现场提问不断,十分精彩。活动最后,现场嘉宾进行了合影留念。

  合影留念

本文转自d1net(转载)
相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
安全 Java Go
Java vs. Go:并发之争
【4月更文挑战第20天】
1069 1
|
10月前
|
弹性计算 JavaScript Ubuntu
WebSocket协议相关的测试命令工具使用简介
本文介绍了针对WebSocket的测试工具wscat和websocat的基本使用方法,以及通过curl命令测试HTTP/HTTPS协议的方式。对于WebSocket,直接使用curl测试较为复杂,推荐使用wscat或websocat。文中详细说明了这两种工具的安装步骤、常用参数及连接示例,例如在ECS上开启8080端口监听并进行消息收发测试。此外,还提供了curl命令的手动设置头部信息以模拟WebSocket握手的示例,但指出curl仅能作为客户端测试工具,无法模拟服务器。
3175 4
|
开发工具 git iOS开发
Mac 安装YCM
① 安装Xcode的同时, 安装配套的命令行工具, 包括git, cmake, clang ② 安装Macvim, 并在~/.bashrc文件中设定别名, alias vim="/path/to/macvim"覆盖系统自带的vim ③ 通过git下载vundle, 下载到~/vim/bundle/vundle ④ 登录YCM的github, 根据官方提供的~/.
2454 0
|
存储 缓存 文件存储
如何保证分布式文件系统的数据一致性
分布式文件系统需要向上层应用提供透明的客户端缓存,从而缓解网络延时现象,更好地支持客户端性能水平扩展,同时也降低对文件服务器的访问压力。当考虑客户端缓存的时候,由于在客户端上引入了多个本地数据副本(Replica),就相应地需要提供客户端对数据访问的全局数据一致性。
32697 79
如何保证分布式文件系统的数据一致性
|
前端开发 容器
HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第8章FlexBox布局(上)
HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第8章FlexBox布局
17748 20
|
设计模式 存储 监控
设计模式(C++版)
看懂UML类图和时序图30分钟学会UML类图设计原则单一职责原则定义:单一职责原则,所谓职责是指类变化的原因。如果一个类有多于一个的动机被改变,那么这个类就具有多于一个的职责。而单一职责原则就是指一个类或者模块应该有且只有一个改变的原因。bad case:IPhone类承担了协议管理(Dial、HangUp)、数据传送(Chat)。good case:里式替换原则定义:里氏代换原则(Liskov 
36680 19
设计模式(C++版)
|
存储 编译器 C语言
抽丝剥茧C语言(初阶 下)(下)
抽丝剥茧C语言(初阶 下)
|
机器学习/深度学习 人工智能 自然语言处理
带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性
带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性
24757 14
|
机器学习/深度学习 弹性计算 监控
重生之---我测阿里云U1实例(通用算力型)
阿里云产品全线降价的一力作,2023年4月阿里云推出新款通用算力型ECS云服务器Universal实例,该款服务器的真实表现如何?让我先测为敬!
36660 15
重生之---我测阿里云U1实例(通用算力型)

热门文章

最新文章

下一篇
开通oss服务