【36页纯干货】大数据与新媒体传播

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:


内容摘要

1、新媒体数据平台

2、新媒体内容平台

3、互动


非常高兴来这里跟大家交流。我的演讲题目是:《新媒体指数和传播风暴的研究》。做传播的人跟研究其他专业的人不太一样,做传播的人既要做内容,还要想到做传播。始终想到我做了这个东西怎么样去做传播。这是传播专业方面的训练。所以相对来说我们会比较关注怎么样把做出来的东西传播好。



首先看一下目前我们面临的整个新媒体的生态。


2014年整体的媒体生态已经跟以前有很大的区别了。在移动互联网上面存在着很大的变化。艾瑞米克在他的统计中,美国人在电视消耗的时间是38%,广告的投入是45%。在移动端,消耗的时间是20%,但是广告的投入是4%。


这意味着在移动端中的广告会逐渐的增加,意味着以后再移动端中,各种包括社交媒体、包括自媒体,他们的广告收入会大幅度的增加。一个微信公号如果你是垂直领域,你现在可以收到比较多的广告费。


如果你有五万粉丝,你的头条文章收两万块钱是没有问题的,当然你不能经常发。移动化带来的整个市场的变革已经非常明显了。



在这里面包括政府体系也有很大的变化,这次我在乌镇世界互联网大会的前一天晚上,乌镇桐乡市的官员给了我一张名片,背面显示的是桐乡的五点优势,任何人拿到这张名片,马上可以进行二次传播,我当时拿到以后就发了,然后马上就有一位媒体打电话进来要采访这位官员。我当时拿到这张名片说,这张名片有一点点缺陷,就是没有二维码。旁边马上有一位官员就站出来说,我这张有二维码。


我前一段在给公务员培训的时候,在他们食堂吃早餐,一个油条、一个馒头,一碗粥,我拍了一张照片发上去,马上就有人给我评论说沈老师,你吃的太简单了,我给你十块钱你去吃一顿好的早餐。



我们如果去研究整个互联网,我们从哪里入手?后来我想到在超级APP和一般的APP之间有一个选择的基点。如果我现在去研究一般性的APP,这个APP行不行?到底能走多远,有什么判断标准。现在如果做成一级用户的APP,这种可能性已经很小了。一级用户APP的痛点已经被大量用户覆盖了。你现在做千万级用户的APP,这种痛点也许还存在,做百万级,也许很多。十万级,也许遍地都是。我们最近一直在关注微信里面的打开率、微博里面转发量。


包括APP打开率,我们可以得到一个明显的感受,如果你的APP打开率、下载量乘起来的值如果小于你本身办的微信公号的打开率乘以用户量,你做APP的意义不是很大。除非你做APP能够给你带来更加全面的数据搜集和更友好的交互性。



基于这样一个想法,我们率先研究微博、微信,然后再研究一般性的APP。在这里我们做了三个小实验,数据、内容、互动。我把这三个点总结为:DCI,这三个东西我们总结起来作为一个团队运行的闭环。



首先是数据,我们做了一个平台,叫做新媒体的指数。这个平台我们现在在这个地方可以看到inm.xuetang.cn。有了这些数据以后,我们先去架构一些影响力的指数。第一个指数我们把它叫做WCI,微信的传播指数。拿到数据以后可以对它做一个综合的测量,这里面的数据我们可以对它进行每天的测量,阅读数、点赞数等等进行分析,然后给他一个评价。


我们在手机上,这个微信公号本身就有一个查询系统,在微信里面你可以直接查到相关的结果。央视晚间新闻WCI值485.12,我们刚刚从9月20号开始做,相对比较原始,今后这个系统会有很多变化。



我们做的WCI的框架,第一,数据公开,免费使用。


第二,评价公开,我怎么样评价每一个公号,评价中的要素、阅读指数、点赞指数,只要微信公布一项新的因子,我们就会把它加进去,因为我们希望是基于公开数据进行评价。


在大数据之前我们有很多评价模型,比如说有SCI,有CSCI,这样一系列的各种排行榜、影响力指标。


目前为止我们没有办法在大数据的平台上面进行所有数据精准的回溯,我们的使命就是希望通过这样一种平台,让我们的评价对象可以回溯自己所有的评价公式已经原始数据。我们自认为达到了前所未有的透明,不断迭代的公式,免费的移动共享。



这是我们对WCI的评价公式。这个公式是9.0版本。为什么这里要分两段?前面的公式都是一段,为什么这里要分两段。因为我们在实践中发现,当我们用WCI评价所有微信公号的时候,头部的数据都是正常的,但是到了尾部数据就不正常了。


比如说点赞,阅读量在一千以下的文章,点赞的数量是很少的。所以我们把它分作两块,后面这一块是降低了点赞的比例。我们目前也带搜集各方面的反应,去看看有没有可能做一个整体迭代,因为我们整体规模已经很大了,所以我们在迭代的时候也会非常慎重。


玩数据的时候我们构建的模式叫两圈一流。清华新闻与传播学院是我们整个平台最核心的组成。在外围是跟我们做各种联盟、技术合作、共同发布数据的协作圈。


我们到目前为止有几十家媒体在使用我们的数据,他在发布各种排行榜。你在市面上看到的各种微信公号的排行榜大部分都是我们这个平台出来的。



中国青年报单榜最高阅读量是两万多次。中国教育报也是在用我们的系统。国资委我们上周跟他一起合办了新媒体年会,他使用我们的数据对中国最大的五百家企业做了公开透明的评价。包括团中央在上个月进行了信息的公布。


我也非常愿意跟今天在座各位一起合作,如果你有一个垂直领域,有一个比较好的媒体渠道、微信公号,我们可以就你这个领域一起发布相关的数据,来推动你这个领域中的排名。


你要问我来做这个领域中的分析和排名对你有什么好处?


第一,当你做了这些分析和排名以后,这些人会主动来找你,我们把这个叫做主动连接。


第二,每个礼拜排,对方会持续的来找你。对你整合你这个领域的资源是非常有帮助的。现在有很多领域,汽车领域、医疗领域都来用我们的数据。所以我提倡一个观念:自搜集、自分析、自运营、自转化。


数据我们分三种状态:


第一种是第二天早上抓,AM派。

第二种是第二天下午抓,PM派。

第三种是稳定派,我们把数据抓回来以后,用WCI一算。


大数据有一个特性,刚开始你的数据是不完备的,没有关系,你运行半个月、一个月数据就完备了。我们的频度是非常高的。移动互联网有一个思维:高频打低频,每天发、每周发、每个月发。原来以前各种研究报告都是以季度或者年度为单位,但是有了大数据以后,随时可以在移动端查询。



刚才介绍的是数据平台,数据平台是完全开放的,也是非商业化的。第二块是内容平台。第一个微信公号是刺猬公社。22号办,目前为止有五万多粉丝。刺猬公社面临的对象是新闻教育界、新闻从业者。


我们在日本有驻日的刺猬公社的观察员。在美国也有驻美的观察员。前一段周永康处理实践,晚上零点有关部门发布,早上八点我们把全国各地的关于周永康的数据总结出来。我们希望把刺猬公社打造成在全球范围内有共同志愿的网友一起参与的基于移动互联网的内容发布平台。


第二个平台最早的创始人是一个草根,他最早的500个粉丝就是到每一个大V的微博下面去看,看他下面这些网友是怎么评论的,发现有某个网友评论以后,他跟这个网友聊,你对这个大V的看法跟我类似,我们到微信里面聊,我现在办了一个微信公号,你能不能加我。


他就是这样积累了最早的500个粉丝,到了第二个月六千粉丝,现在三万多粉丝。所以我后来总结,500个铁粉足以扫天下。你不需要很多人。历史上红军长征到了延安,也没有多少人,满人入关也没有多少人。移动互联网里面精英的团队打击草蛮的部落。



第三,亚洲善待博士组织。


我一般把它建成为善待博士。全是用户产生的内容,这是一个网友投稿,投稿的都是博士。大量的图片都是女博士的照片。还有很多是非常有意思的各种跟科研相关的议题。这是一个网友投的稿,全球的博士性别比例的图片。


有网友根据这个图片吐槽:台湾不是一个国家,马上有人指出这个照片的政治错误。泰国女博士比男博士多。有人猜测也有一部分人妖去当博士了。我们现在想能不能打通一个虚拟的博通社,通过博士的聚合来做一些工作。我们团队本身已经实现了从自媒体走向群媒体的模式。



第三块是互动。


我们有数据、有内容了,还要考虑互动,只有互动了才能把人紧密的联系起来。目前为止我们办了七期沙龙。后天下午在这个教室还会办一个沙龙。


现在有了内容之后,办沙龙和线下活动很简单,嘉宾邀请,你发一个通知嘉宾就来了。再发一个通知,网友就来了。自媒体积累到一定程度以后就形成了良性循环。我们还有其他的理想,但是我们可能需要很大的努力才能实现。



我们自身利用这些数据平台也做了简单的分析,目前我们只做了三个月,没有特别高质量的国际研究。但是我们现在做的基本是简单的统计。希望到了明年上半年我们能够出一些比较有价值、深度的研究。对前面五百强的微信公号我们做了分析,科技类占到阅读数多少,文化类占多少,资讯类占多少。



我们现在对重点省份做了标注,北京市整体微信公号的分布是什么样的。比如说北京吃货,我们跟他聊,你这个北京吃货哪些地方好玩,他的博主告诉我,每次聚会的时候来的都是美女,除了博主本人是男生之外。


这是一种受众的分析,你的粉丝到底是什么样的人。从这些角度我们可以发现,我们可以利用这个平台做很多事情。



这是我们最近做的项目,里面谈到的是舆情的意见领袖的分析。公布令计划事件当天晚上是八点,但是那天晚上有一个第三方机构邀请了一批偏红色价值取向的大V聚会,我也在那里。


当时的主持者跟大家说八点有重大新闻,希望大家今天晚上不要发微博了,我们来一个关机挑战。那天晚上基本上红色价值取向派没有人发微博,都在那里吃饭。我不仅仅要做数据分析,还要利用传播学的优势跟这些人接触,了解这些人。


从天涯时代,到微博、到微信时代。在这些网络江湖的弄潮儿中始终都是这样一批人。也有少量的借助平台红利崛起的对象。但是相对来说这个量是比较小的。整体来说他是相对稳定的状态。



如果我们用大数据去分析,传播风暴是怎么兴起的。比如说嘉兴市一个漫画家叫朱自尊,他画了比较好的漫画,习总把权利关进制度的笼子,他转发以后,被工梦嘉兴转发了,又被我抓发了,然后又被别人转发了。这个漫画就火了。


习总去韩国访问的时候,大家传播的是习总年轻时候跟都教授长的很像。很多美女就关心习总这一次的访问了。美女是互联网里面流量的发动机。美女关注以后,许多男生就开始关注了。


昨天我在中央网新办的新闻发布会上,我事先跟几位朋友说了,新郑市的农民就给我寄了几张羊年的剪纸。今天早上我@赵霞剪纸,他就会转发,跟他相关德人就会转发。传播中一定要借势而为。


还有一点是通过小V撬动中V,再撬动大V。现在我们一方面是通过央媒,全国通稿的模式来撬动舆论场。另外一种模式是通过社区媒体中的中小V撬动大V的转发。



我们对微博助农的行为做了很多的分析,包括他们的滞销产品。你会发现,春天土豆卖不动,秋天土豆卖不动,冬天土豆还是卖不动。当他滞销以后有没有这个平台发布这个消息。我们团队的重点2015年就是利用新媒体帮助各个垂直领域做好大数据的分析工作。



这里我们也对农业营销能力做了评估。对微博中一千多个研究对象做了细化。每一个跟农业相关德新农人、新农商的能力,我们给了一个简单共识。



我们对民航行业做了一些分析。我们估算了一下,南航的社交资产总之2800多万,东航是2400万。我们可以通过大数据分析舆情事件中各种活跃的参与者。


深圳磁悬浮八号线的事件中,这成为了一个左右对攻的舆情事件,我们结合大数据、结合我们日常的理解,可以分析出来这已经成为一个左右对攻的事件。



总结起来,我们今后的方向:


第一,动态的迭代,每天进步一点;

第二,多态化,我们要研究微博、研究微信、研究一般APP的基础数据;

第三,数态化;

第四,生态化。


我们希望建立起专家的协作圈、媒体协作圈、技术协作圈、商业协作圈。在网络的浪潮中需要居卑登高、守静制动、求真务实。找到新媒体发展的定位。


原文发布时间为:2017-02-27 

本文作者:沈阳

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1天前
|
存储 人工智能 数据管理
|
1月前
|
人工智能 Cloud Native 数据管理
媒体声音|重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
在2024云栖大会上,阿里云瑶池数据库发布了首个一站式多模数据管理平台DMS:OneMeta+OneOps。该平台由Data+AI驱动,兼容40余种数据源,实现跨云数据库、数据仓库、数据湖的统一数据治理,帮助用户高效提取和分析元数据,提升业务决策效率10倍。DMS已服务超10万企业客户,降低数据管理成本高达90%。
163 19
|
1月前
|
数据采集 机器学习/深度学习 搜索推荐
大数据与社交媒体:用户行为分析
【10月更文挑战第31天】在数字化时代,社交媒体成为人们生活的重要部分,大数据技术的发展使其用户行为分析成为企业理解用户需求、优化产品设计和提升用户体验的关键手段。本文探讨了大数据在社交媒体用户行为分析中的应用,包括用户画像构建、情感分析、行为路径分析和社交网络分析,以及面临的挑战与机遇。
|
6月前
|
机器学习/深度学习 自然语言处理 大数据
社交媒体的情感分析大数据模型
构建基于大数据的情感分析模型,利用Python和机器学习处理社交媒体数据。情感分析识别文本情感倾向,助力市场洞察和舆情监控。技术栈包括Python、NLP库(nltk, spaCy, TextBlob, VADER)、Scikit-learn、TensorFlow/PyTorch及大数据工具。数据收集(如Twitter API)、预处理(去除噪声、分词)、特征提取(TF-IDF、词嵌入)、模型训练(逻辑回归、BERT)是关键步骤。模型能捕捉文本情感,支持决策,随着技术进步,应用前景广阔。
586 10
|
7月前
|
搜索推荐 大数据
大数据在社交媒体领域的应用有哪些?请举例说明。
大数据在社交媒体领域的应用有哪些?请举例说明。
222 0
|
机器学习/深度学习 大数据
《构建基于富媒体大数据的弹性深度学习计算平台》电子版地址
构建基于富媒体大数据的弹性深度学习计算平台
101 0
《构建基于富媒体大数据的弹性深度学习计算平台》电子版地址
|
存储 人工智能 监控
应急管理大数据社会化治理体系下媒体数据的价值
近年来,我国应急安全管理工作取了了巨大的成绩,但是,从一些突发应急安全事件处置的情况来看,我们的应急安全处置能力建设尚存在很多短板。当前,我国全社会上下正在进行一场数字化、智能化革命,将数字化和智能化技术引入应急安全管理领域,是提高我国应急安全管理水平,增强对应急安全事件处置能力,最大程度减少应急安全事件对我国社会的所造成的的生命和财产损失的必然选择。
589 0
应急管理大数据社会化治理体系下媒体数据的价值
|
存储 分布式计算 自然语言处理
基于MaxCompute的媒体大数据开放平台建设
随着自媒体的发展,传统媒体面临着巨大的压力和挑战,新华智云运用大数据和人工智能技术,致力于为媒体行业赋能。通过媒体大数据开放平台,将媒体行业全网数据汇总起来,借助平台数据处理能力和算法能力,将有价值数据内容和能力开放给用户。本文主要从新华智云数芯平台,媒体行业数据特征,批流处理数据架构,以及通用的媒体大数据平台能力等几个方面介绍了如何基于MaxCompute做媒体大数据开放平台建设。
2167 0
|
存储 分布式计算 算法
基于MaxCompute的媒体大数据开放平台建设
摘要:随着自媒体的发展,传统媒体面临着巨大的压力和挑战,新华智云运用大数据和人工智能技术,致力于为媒体行业赋能。通过媒体大数据开放平台,将媒体行业全网数据汇总起来,借助平台数据处理能力和算法能力,将有价值数据内容和能力开放给用户。
5761 0
|
大数据 数据库
大数据在媒体行业的应用——《企业大数据实践路线》之二
阿里云MVP戚俊带你以媒体行业为例,深入分析大数据在媒体行业的应用
2692 0