产品原理摘要:最快2分钟感知数据;海量源站抓取+语义识别+情感趋势分析+传播路径+受众画像=透视趋势。
今年四月份,阿里云ET(ET的前身是阿里云小Ai)预测《我是歌手》决赛名次,在比赛的3个小时里实时分析了几百万条微博内容,这帮助ET成功预测了粉丝投票排序,所以说“公众趋势分析”(https://data.aliyun.com/product/prophet) 这款产品是ET的“一只眼睛”。
对于个人来说这款产品也有帮助,相当于全媒体订阅新闻和告警。购房、落户、入学、买车上牌之类的事情,订阅之后有什么消息可以第一时间接到通知。比如个人开始关注小孩入学了,配好订阅专题之后,每天扫一眼Top10的新闻评论,各种政策形势也就基本了解了。
当然,“公众趋势分析”也能做一些有趣的分析。
以迪士尼开园为例,ET手把手教你采集和分析海量数据。
比如,我们可以观摩一下传媒的影响力。6月16日上海迪士尼正式开园,零点刚过,中国新闻网发了一篇图文并茂的开园介绍,并提醒大家园内主题酒店6月份全订满了。紧接着转载次序如下:
00:03中国新闻网
00:07网易新闻
00:11搜狐新闻
00:16新浪新闻
……
到早上8点,已经有腾讯网、和讯网、凤凰网、央广网、环球网、金融界、21世纪等超过300家媒体相继转载这篇新闻,整体舆论情感持续保持在+80以上。8点过后,自媒体的大V、公众号开始接力,一张无形的网已经准备就绪。当天你只要打开手机,必定会看到迪士尼的新闻。这就是媒体矩阵的力量,迪士尼果然是大手笔。
由于16日是开园并且只有半天,我们继续观察17日完整一天的评论情感走势。一般来说,每天的网上活动应该是从凌晨4点开始,不过17日舆论情感值提前到凌晨2点就开始上扬,编辑同行熬夜审完稿子开始了新一天的报道。当天的情感最低值反而出现在早上9点,迪士尼入园之前的漫长排队终于让人忍不住抱怨了,大热天的进个门排两小时队,只能刷微博吐槽。入园之后稍作惊艳,抢FP继续排队。下午1点和4点的两场花车巡游最受欢迎,还有晚上8点的烟花秀,终于值回票价了。挤地铁回到酒店稍作休整,开始晒照片刷朋友圈。
自媒体对于迪士尼一直都很有热情。比如阿里旅行发的这条微博,一周来已经有近3万次转发,1720万的曝光量:
实际上,微博的传播生态具有复杂的多样性,并仍然在迅速发展。网红不是一天练成的,举几个例子,微博的传播模型多种多样:
(1)官微大V+辅助延伸型
(2)多路衍生覆盖型
(3)友情助攻型
(4)以及教科书似的层次递进型,堪称完美的传播模型
最后补一张图。先声明,这只是进行中的一项技术试验,持续观察证券多空情绪与其价格之间的时间偏移和相关性。如果得到好的相关性模型,O(∩_∩)O,此乃不传之秘。
公众趋势分析这款产品刚在数加上对外开放,为了让广大商家都能用上此产品,特面向所有用户提供69元/年秒杀活动,每天限量20个,8月31日结束,秒杀地址:https://data.aliyun.com/promotion/prophet
应用场景
企业品牌:分析消费者对品牌的认知和注意力迁移,关注竞品分析,塑造品牌口碑。
政务机关:践行网上群众路线,广开言路,凝聚共识,提升服务效率和口碑。
传媒行业:发现事件热点,梳理传播脉络,跟踪栏目受众的喜好倾向,鉴别新闻炒作。
金融行业:商贷行业风险评估,P2P金融舆论风险评估,证券多空情绪波动与分析。
地产行业:区块楼盘质量口碑监测,分析潜在业主的喜好倾向,物业服务质量评估。
教育行业:关注教育资源供需平衡,校园热点事件预警,提高教育事业的满意度。
医疗行业:关注医疗资源供需平衡,医患纠纷预警,提升医疗服务质量。
旅游行业:倾听游客反馈,预判旅游出行趋势和热门程度,提升旅游服务的体验。
产品特点
快速感知:高优先级源站最快2分钟获取数据,常规源站平均10分钟获取数据。
全面覆盖:基于全网公开数据(千万源站,每日更新20亿网页),覆盖各类网站、论坛、自媒体,特殊站点可提交需求订制。
精准有效:机器学习、自然语言、文本处理的协同处理,通过客户参与模型训练,准确率最高可达95%以上。
分级告警:根据信息来源、作者身份、敏感事项等自动判定风险级别(P1~P4),分时段分级告警。
智能分析:提供传播路径分析、热点事件分析、情感分析、热词云、标签分析、智能模版过滤。
协同处理:处置功能丰富,包括数据标签、事件管理、观点、地点、标记、过滤、备注、自定义属性等。
深度集成:定向开放API,合作伙伴可深度集成,为客户量身打造“限量版”。
支持小语种:关键词匹配、情感分析、聚类分析支持19种语言:中文、英语、俄语、法语、日语、韩语、西班牙语,德语、葡萄牙语、荷兰语、意大利语,阿拉伯语、土耳其语、希伯来语、波兰语、印地语、印尼语、越南语、泰语。
产品故事:
“公众趋势分析”源于内部的一款产品,其本职是用来搜集用户反馈,支撑了几百个业务团队直面用户的吐槽。以往传统的反馈方式是:业务异常->用户反馈->客服记录->业务排查->客服反馈->回复用户,这种模式效率低下,中间过程的信息传递失真,并且不是每个用户都愿意花时间反馈,也许网上抱怨一下就直接用脚投票了。而互联网本身就是触达用户、感知公众态势的最有效方式,通过该产品,业务方可以第一时间倾听用户心声,并通过预判用户群体的喜好倾向,指导产品和服务的改进升级。