手把手教你分析微信群聊记录,识别害群之马-阿里云开发者社区

开发者社区> 大数据文摘> 正文
登录阅读全文

手把手教你分析微信群聊记录,识别害群之马

简介:

0?wx_fmt=jpeg

导读:很多朋友加入了很多微信群,作为群中一员,你想知道这个群是否值得留下?而作为群主,你想了解目前这个群是否健康?如果有问题,那么坏了这锅粥的老鼠屎是谁?应该怎样设立群规?本文通过简单的分析给出思路,抛砖引玉,希望大家多提建议和意见。


作者:汪德诚 大数据文摘创办人


思路

人有人的调性,群有群的调性。观其言行,可对其进行粗略判断,时间跨度越长、信息越多,判断就准确。先把群聊天记录下载下来,看看能有什么收获。


数据收集

(1) 选择一个样本群:XX技术交流群

(2) 导出微信群聊记录到EXCEL


数据分析

导出的聊天记录格式为:时间、联系人、状态、类型、消息

  • 时间:发送或接收消息的时间

  • 联系人:群中昵称

  • 状态:接收/发送,发送表示“我”发出的消息

  • 类型:地理位置/动画表情/名片/视频/图片/网页/文本/系统消息/小视频/语音,一般来说网页指转发的文章,文本指发出的文字

  • 消息:聊天记录的内容


初步观察,群聊记录从2015/5/1 到2015/12/31,总计15112条,群现有成员494人。


个人感觉这个群还是一个很高端的交流群,进群由群主统一邀请,不会有人擅自邀请人进群,也没有什么广告,经常有人针对一个问题发起讨论,那么实际情况是否这样呢?我们看看统计数据


按”类型“统计

0?wx_fmt=jpeg

网页类型有2082条,占比有14%,总体看这是一个健康群,大部分的交流还是以文字为主,转发的文章不是很多。


不难想象,极端情况,如果群里的人都在转发文章,却没人说话,那么这个群也就没有什么价值了,因为这个群是没有思想的,大家都转发。转发文章和讨论的比例是多少你?没有一定之规,得看群定位,也要看分享的内容。但不管怎么说,如果群成员间交流少了,这不是好的趋势。


虽然目前这个群看似健康,但是未来还会健康吗?趋势很重要,既然要预测,就要加入”时间“维度。


按”类型“统计+时间

0?wx_fmt=jpeg


发现什么?网页(转发文章)的数量并没有增加,反而减少了,可是再看文本的数量,下滑的趋势非常明显,增加一列 网页/文本,看看


0?wx_fmt=jpeg


网页/文本比例如下图

0?wx_fmt=jpeg

可以看出,转发文章的比例越来越高了,群有越来越水的趋势啊!那么到底哪些人在转发文章?


按类型统计+时间维度+具体人员

0?wx_fmt=jpeg


此群共有人员494人,转发过文章的有249人,进一步分析可得

0?wx_fmt=jpeg

可以看出,转发的人不多,但是占比非常大,那么接下来我想知道:经常转发文章的人是否说话参与讨论?


统计:TOP10 转发人员,转发占比

0?wx_fmt=jpeg

初步判断 YJJ,LFY,HXG3人基本不参与讨论,只是转发文章,他们在转发什么?没转发时说什么?必须看原始数据了。


核实验证

经查看,这3人,大部分的时间都在转发文章,而且转发的文章几乎都来自同一个公众账号,即使发言也有很多是无效发言,比如:“感谢XXX”,或是今日公号文章的摘要…基本都是在推他自己的公号。基本可以确定,这3个人就是害群之马。


决策

作为群众,你可以选择留下还是离开

作为群主,你要关注群的现状、趋势,找到问题所在,制定适当的群规并监控执行。


总结

本文只是一个简单的分析案例,以聊天记录数量为基础,逐步加入时间、个人维度,分类统计,为群的运营提供一个思路。其实可分析的内容很多,比如对群管理人员发言的分析,能够看出群管理者对群的热情,再比如通过分析群内互相@,可以看出谁和谁经常公开秀恩爱,哈哈。


另,"群健康度"这个指标,没有统一的标准,和群设立的目标紧密相关。


如果你对群运营有感兴趣,可以加我的微信dataforall,备注“群运营”,我会建一个交流群,在这个群,我希望大家以交流为主,而且我会监控这个群的健康程度:)



附:Excel种操作方法:

(一)按类型统计

(1) 导出的聊天记录在Sheet1,新建Sheet2


(2) 选中类型列全部数据,拷贝到sheet2

0?wx_fmt=jpeg


(3) 选中类型列全部数据,拷贝到sheet2,删除重复项

0?wx_fmt=jpeg

0?wx_fmt=jpeg

0?wx_fmt=jpeg


(4) 计算各类型聊天记录数量

0?wx_fmt=jpeg

用到公式:COUNTIF

0?wx_fmt=jpeg


(二)类型+时间

(1)按月统计,sheet1列加入“月份“列

0?wx_fmt=jpeg


(2)按月分类统计

0?wx_fmt=jpeg
技巧:使用公式countifs可以快速、自动统计,注意公式中$符号的运用,单元格B18做好后,只要向右、向下拖拽,就能自动生成其他数据了。上面的例子肯定可以正常运行,有疑问的请各自百度查询了。


(三)网页类型+时间+个人

0?wx_fmt=jpeg



原文发布时间为:2016-01-01

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
大数据文摘
使用钉钉扫一扫加入圈子
+ 订阅

官方博客
官网链接