2020微博热点数据简析,附完整数据文件下载!

简介: 2020微博热点数据简析,附完整数据文件下载!

转眼之间,2021年的春节假期就要结束了,真的是太快了!

今天再分享一份超级棒的数据,就是2020年全年的微博热点数据,说实话,这里面如果认真分析的话,还是可以找到很多有意思,有价值的信息的。

但是由于我已经写过一篇2019年微博热点数据分析的文章了,这里就不再重复了,有兴趣的同学可以点击这里查看

2019微博热点分析

这里分享数据出来,希望更多的朋友可以从数据当中挖掘出更多的有价值的信息,大家一起学习进步!

下面是一些简单的数据汇总,欢迎大家一起讨论

搜索次数排行

全年微博热搜,最为直观的就是搜索次数了

可以看到小猪的分手消息还真的是高啊,毕竟是可以完美的进行时间管理的人儿啊

热搜关键词

下面来根据热搜标题,进行关键词的划分,来看看不同词汇的出现次数

这里使用著名的 jieba 来进行分词处理,然后分别提取出人名,名词已经动词

import jieba.posseg as psg
import jieba
weibo_title = df['keyword'].values.tolist()
name_list = []
noun_list = []
verb_list = []
for i in weibo_title:
    result = psg.cut(i)
    for x in result:
        if x.flag == 'nr':
            name_list.append(x.word)
        elif x.flag == 'n':
            noun_list.append(x.word)
        elif x.flag == 'v':
            verb_list.append(x.word)

分词做好之后,就可以进行词汇数量的汇总,并进行排序

name_counts = {}
stopword = ['陈', '李', '杨', '王', '郭', '吴', '周', '明星', '辟谣']
for w in name_list:
    if w not in stopword:
        name_counts[w] = name_counts.get(w, 0) + 1
sort_counts = sorted(name_counts.items(), key=lambda item: item[1], reverse=True)

最后我们来看看对应的排名靠前的词汇图片



1人名


前美国总统竟然高居榜首,看来微博用户还都是很关注国际形势的,也包括华为、荣耀等,这都是大国之间博弈的体现!



2名词


新冠、肺炎占据着前两位,在这个不平凡的2020年里,我们大家注定都会不平凡!



3动词


动词就看看吧,不多说了

最后还是以动态视频来结尾,祝大家在新的一年里,工作顺心,事事如意!

相关文章
|
安全 数据安全/隐私保护 Windows
解锁安全之门,Windows Server 2019密码修改攻略大揭秘
解锁安全之门,Windows Server 2019密码修改攻略大揭秘
1322 0
微信分享报错 wxlog:Error:fail to load Keychain status:-25300 解决办法
微信分享报错 wxlog:Error:fail to load Keychain status:-25300 解决办法
3879 0
Apple Push Services不受信任解决方法
Apple Push Services不受信任解决方法
597 59
|
存储 运维 监控
超越传统模型:从零开始构建高效的日志分析平台——基于Elasticsearch的实战指南
【10月更文挑战第8天】随着互联网应用和微服务架构的普及,系统产生的日志数据量日益增长。有效地收集、存储、检索和分析这些日志对于监控系统健康状态、快速定位问题以及优化性能至关重要。Elasticsearch 作为一种分布式的搜索和分析引擎,以其强大的全文检索能力和实时数据分析能力成为日志处理的理想选择。
995 6
|
算法 测试技术 数据安全/隐私保护
没有接口需求文档,如何开展接口测试?建议收藏
没有接口需求文档,如何开展接口测试?建议收藏
476 1
|
人工智能 自然语言处理 算法
HippoRAG 2:开源RAG框架革新知识检索,多跳推理+持续学习全搞定
HippoRAG 2 是俄亥俄州立大学推出的检索增强生成框架,通过个性化PageRank算法和知识图谱技术,显著提升了RAG系统在复杂问答任务中的表现。
1639 2
HippoRAG 2:开源RAG框架革新知识检索,多跳推理+持续学习全搞定
|
存储 安全 Linux
离线Linux服务器环境搭建
【9月更文挑战第3天】在离线环境下搭建Linux服务器需按以下步骤进行:首先确定服务器用途及需求,准备安装介质与所需软件包;接着安装Linux系统并配置网络;然后设置系统基础参数,如主机名与时区;安装必要软件并配置服务;最后进行安全设置,包括关闭非必要服务、配置防火墙、强化用户认证及定期备份数据。整个过程需确保软件包的完整性和兼容性。
508 3
WK
|
测试技术 开发者 Python
python模块化设计
Python的模块化设计支持开发者将代码拆分成独立模块,提升代码的可读性、可维护性和复用性。通过`.py`文件定义模块,并利用`import`语句导入所需功能,同时可通过包含`__init__.py`的目录创建包以组织多个模块。Python按特定顺序搜索模块,支持修改`sys.path`添加自定义路径。此外,支持相对与绝对导入方式,便于灵活使用模块资源。遵循良好的编程习惯有助于开发高质量的可复用模块,而虚拟环境与依赖管理工具则确保项目间的依赖隔离,进一步增强项目的稳定性和可扩展性。
WK
393 2
|
存储 分布式计算 Java
Java在云计算中的应用如何?
Java在云计算中的应用如何?【8月更文挑战第11天】
615 4
|
Java API 网络架构
Spring Cloud Gateway的高级配置与实践
Spring Cloud Gateway的高级配置与实践

热门文章

最新文章