虎扑论坛数据分析

简介: 虎扑论坛数据分析

论坛为用户提供了相同的业余爱好,互动和交流的广阔平台,以及由此产生的庞大数据和复杂的用户交互场景也包含有价值的信息,本文关于虎扑论坛的帖子,个人信息分析,探讨虎扑论坛的用户是什么是什么特点?

tecdat研究人员分析了2018年1月Tiger Walk论坛每个部分的所有帖子,使用数据探索用户行为并概述用户偏好。

以下是虎扑的官方介绍摘录:虎扑是一个专业的年轻男子网站,涵盖了原有的新闻专栏视频报道,包括篮球,足球,F1,NFL等大型生活/视频/游戏/ car / digital在线交流社区,谈论体育谈话对虎扑的兴趣。


数据显示

数据源:

2018年1月虎屁论坛步行街所有分段的所有帖子,删除低度关注的帖子,总数为3.3W +;

以上3.3W +帖子在主干部分回复用户的个人信息,用户总重量为2.3W +。


社交和交易属性是活动的关键

在虎扑社区由10个分论坛,380个分论坛组成,发帖量达到70W +,哪个最活跃呢?

通过比较每个部分的帖子数量,您可以看到在大型子论坛中,[设备论坛]的帖子数量最多,其次是Pedestrian Street和[NBA]; 在380个小节中,[Main Street Pedestrian]和[IT Digital]最受欢迎,其次是[Cheyou exchange]和[burst]; 其中,[行人]岗位占近7成,远高于其他。


可以看出,交易属性和社交属性是维持社区热情和用户活动的关键。


除了体育,约会八卦也是最受关注的话题

除了交易部分,[Pedestrian]和[NBA]是虎扑最活跃的部分,[NBA论坛]主题一般围绕比赛开始,而[行人]社会属性相对较强,通过[Pedestrian]分析,看看老虎扑动的其他成员在体育赛事中关注的是什么。

通过文字云分析所有步行街的帖子内容,删除上面提到的高频词50,可以得到以下词云图。从单词云图中可以看出,步行街区的讨论内容经常被提及情感关键词,如“女朋友”,“朋友”和“喜欢”,可以推断成员Tiger Puff社区主要是年轻人;

富裕,体育,篮球也经常被提及关键词,可见胡鹏体育运动成员更强; 同时,我们还可以看到词云还包括李小璐,特步等关键词,我们可以看到热门八卦而且知道热门话题的话题也非常关注;

此外,“大学”,“室友”,“毕业”等也经常被提及,表明虎扑社区活跃在一群大学生中。

综上所述,我们可以初步猜测,虎扑成员以青年男子和大学生为主,他们喜欢篮球等体育,交友是他们最关心的话题,他们也喜欢讨论一些八卦热点和了解微博等热门话题。


用户分析

用户性别

除了不愿透露性别用户外,步行街的剩余活跃用户中,女性仅占4.5%,这与虎扑社区的物理属性基本相同。


用户的位置

从下面的地理分布可以看出,步行街的活跃用户主要分布在经济发达的省市,如广东,江苏,北京,浙江和上海,上述五个地区占50%以上。总;


用户日逗留时间

通过计算用户注册天数和在线持续时间,可以发现虽然45.5%的用户每天使用不到半小时,但超过30%的用户花费超过一小时超过一小时,表明由洗发水社区提供的内容更具吸引力。


总结一下

总的来说,虎扑成员以青年男子和大学生为主,他们喜欢篮球等运动,关注NBA,英超等联赛; 但是行人社区,他们的话题不仅限于体育,八卦,情感咨询,他们关注的内容也是如此; 而且他们在虎扑中停留的时间更长,虎扑的内容可以很好地把握当前的用户群体。

相关文章
|
算法 数据挖掘 大数据
到底什么才是数据分析思维? by彭文华
到底什么才是数据分析思维? by彭文华
|
前端开发 安全 数据挖掘
这是一篇讲解用户行为分析的推荐书单和总结
推荐有关用户行为的书单,对其中一本进行总结:能对用户行为数据发挥价值的过程建立系统的认知,主要是给出了指标体系的建设,针对搜索这个场景举了一个例子。让读者能够快速实践。
407 0
|
人工智能 大数据 Java
大数据肌肉猿公众号年终总结(文末福利)
大数据肌肉猿公众号年终总结(文末福利)
大数据肌肉猿公众号年终总结(文末福利)
|
数据采集 数据挖掘 Linux
躁动不安的年代,你需要读几本好书(python爬虫及数据分析)
当今社会,速度已经深入人心了,“快”成了大家默认的办事境界,看机器上一件件飞一般传递着的产品,听办公室一族打电话时那种无人能及的语速......休闲的概念已日渐模糊,大家似乎都变成了在“快咒”控制下的小人儿,似乎连腾出点时间来松口气的时间都没有了,看得见的、看不见的规则约束着我们;有形的、无形的的鞭子驱赶着我们,我们马不停蹄追求事业、爱情、地位、财富,似乎自己慢一拍,就会被这个世界抛弃 工作仅仅是生活的一部分,千万不要忽略了其他乐趣,人生本是一幅美丽的风景画,不必对所有的事情都抱有强烈的目的性,人的一生总有做不完的事情,只要我们有一个平和之心,就不会错过沿途风景。
874 0
|
分布式计算 监控 物联网
【好书试读】大数据处理之道
近年来,“大数据”已然成为IT界如火如荼的词,与“云计算” 并驾齐驱,成为带动IT行业发展的两列高速火车。尤其是在物联网快速发展的时代,数据已经被称为新的资源,是支撑物联网发展的基石。
2889 0
|
数据采集 Python Web App开发
Python爬虫入门教程 23-100 石家庄链家租房数据抓取
1. 石家庄链家租房数据-写在前面 作为一个活跃在京津冀地区的开发者,要闲着没事就看看石家庄这个国际化大都市的一些数据,这篇博客爬取了链家网的租房信息,爬取到的数据在后面的博客中可以作为一些数据分析的素材。
1335 0
|
分布式计算 监控 安全
课堂随笔1 - MOOC网站日志分析
大数据Clouder:MOOC网站日志分析 日志,log,事件记录网站日志:系统日志,程序日志 网站的系统访问日志,有通用格式 网站日志分析:(1)价值/重要性:运行,安全,运营,用户信息(2)流程:采集,处理,展现,结果 重要性:①网站运行状况(如网站PV,UV),②网站安全状况(如恶意攻击,密码暴力破解),③网站运营状况(如搜索引擎流量来源),④网站用户信息(如操作系统,浏览器)。
2503 0
|
机器学习/深度学习 人工智能 算法
书单推荐 | 数据挖掘和统计科学自学十大必备读物
本文讲的是书单推荐 | 数据挖掘和统计科学自学十大必备读物,下面的免费书单中从统计学基础知识,到机器学习的基本概念,再到更重点的大框架内容,对于高深的话题也有所涉猎,最后以一本总结性的书结尾。既有经典名著,也有当代的作品,希望你能在其中找到一些有趣的新内容。
3598 0
下一篇
DataWorks