用Python对微博热搜做舆情分析~

简介: 大家好,我是志斌~今天志斌看微博热搜的时候,发现这样一条热搜。

大家好,我是志斌~


今天志斌看微博热搜的时候,发现这样一条热搜。


49.png



我寻思,这要真的改了,真的炸锅!所以志斌爬取了这条微博下的数据,进行了一个简单的舆情分析!


需要源码的同学,加志斌微信获取哈~


01数据采集


志斌在之前的两篇文章中,详细的介绍了如何获取微博评论,有兴趣的读者可以看看这两篇文章。这里志斌直接展示核心代码了,代码如下:

for page in range(1,10000):
  if page == 1 :
      params = (
          ('id', '4654152979845247'),
          ('mid', '4654152979845247'),
          ('max_id_type', '0'),
      )
  #s = requests.Session()
  response = requests.get('https://m.weibo.cn/comments/hotflow', headers=headers, params=params)
  a = response.json()['data']['max_id']
  b = response.json()['data']['max_id_type']
  for i in response.json()['data']['data']:
      pinglunshijian = i['created_at']
      neirong = re.sub(r'<[^>]*>', '', i['text'])
      id = i['user']['id']
      yonghumingcheng = i['user']['screen_name']
      with open(r'71.txt', 'a', encoding='utf-8') as f:
          f.write(f'{neirong}\n')
  params = (
      ('id', '4654152979845247'),
      ('mid', '4654152979845247'),
      ('max_id', str(a)),
      ('max_id_type', str(b)),
       )
  print(f'爬取第{page}页数据......')
  time.sleep(random.randint(1,3))


02可视化分析


我们来对这些数据进行可视化分析。本次绘图使用的是Excel和Tableau两款软件。


01 点赞数top10用户


50.png


我们发现椭圆圆子这个用户所发表的评论点赞数最多,有9.5w+,下面让我们看看它的评论是什么,竟然让用户这么喜欢。


51.png



这是一句纯吐槽的话,点赞数这么多,可能是因为发的时间早,或者是引起了老师们的共鸣。


02 评论日期分布


52.png


从图中我们可以清晰的看出,7.6号发表评论的人数最多,可能跟今天上热搜有关系的原因,毕竟上了热搜,曝光度就高了!


03 评论时间分布


53.png



对6号评论发布时间进行分析,我们发现19点发表的评论数量最多,我当时看到这条热搜的时候,基本也是这个时间,看来热搜对一个消息的影响还是很大的。


04 词云图


54.png


通过词云图可以看出,人们围绕这寒暑假这个词讨论的非常热烈,学生和取消、行业等词也被大量提及,我翻了翻评论,发现大部分人都是不想取消的。当然志斌也觉得不要取消。


03小结


1. 通过分析我们可以看出,热搜对每条微博的影响是巨大的。

2. 大家都不太愿意取消寒暑假。

3. 本文仅供学习参考,不做它用。

4. 需要源码的同学,加志斌微信获取哈~

相关文章
|
5月前
|
数据采集 存储 自然语言处理
基于Python的微博热点李佳琦忒网友话题的评论采集和情感分析的方法,利用情感分析技术对评论进行情感倾向性判断
本文介绍了一种基于Python的方法,用于采集微博热点话题下的评论数据,并运用情感分析技术对这些评论进行情感倾向性判断,进而通过统计分析和可视化技术展示网友对特定话题的情感态度,对品牌或个人形象管理、用户需求发现、舆情监测和危机管理等方面具有重要价值。
101 2
基于Python的微博热点李佳琦忒网友话题的评论采集和情感分析的方法,利用情感分析技术对评论进行情感倾向性判断
|
5月前
|
机器学习/深度学习 数据采集 算法
【python】python基于微博互动数据的用户类型预测(随机森林与支持向量机的比较分析)(源码+数据集+课程论文)【独一无二】
【python】python基于微博互动数据的用户类型预测(随机森林与支持向量机的比较分析)(源码+数据集+课程论文)【独一无二】
|
6月前
|
自然语言处理 算法 安全
Python实现贝叶斯算法疫情微博评论情感分析
Python实现贝叶斯算法疫情微博评论情感分析
Python实现贝叶斯算法疫情微博评论情感分析
|
7月前
|
数据采集 存储 API
用Python打造你的微博热搜追踪器
在当今信息爆炸的时代,获取最新、最热门的信息成为了许多人的日常需求。微博热搜榜作为反映社会热点和公众关注焦点的重要窗口,其信息价值不言而喻。本文将介绍一个实用的Python爬虫程序,它能够自动爬取微博热搜榜的信息,并通过邮件的形式将这些信息发送给用户,帮助用户及时了解社会动态,把握热点趋势。
|
8月前
|
监控 数据可视化 NoSQL
Python基于Flask的高校舆情分析,舆情监控可视化系统
Python基于Flask的高校舆情分析,舆情监控可视化系统
157 0
|
8月前
|
数据采集 存储 数据可视化
微博数据可视化分析:利用Python构建信息图表展示话题热度
微博数据可视化分析:利用Python构建信息图表展示话题热度
|
8月前
|
Python 自然语言处理 Java
Python每日一练(20230403) 随机正整数、微博热门话题、恢复二叉搜索树
Python每日一练(20230403) 随机正整数、微博热门话题、恢复二叉搜索树
57 0
Python每日一练(20230403) 随机正整数、微博热门话题、恢复二叉搜索树
|
数据可视化 JavaScript 前端开发
基于Python的微博大数据舆情分析,舆论情感分析可视化系统
基于Python的微博大数据舆情分析,舆论情感分析可视化系统
|
27天前
|
人工智能 数据可视化 数据挖掘
探索Python编程:从基础到高级
在这篇文章中,我们将一起深入探索Python编程的世界。无论你是初学者还是有经验的程序员,都可以从中获得新的知识和技能。我们将从Python的基础语法开始,然后逐步过渡到更复杂的主题,如面向对象编程、异常处理和模块使用。最后,我们将通过一些实际的代码示例,来展示如何应用这些知识解决实际问题。让我们一起开启Python编程的旅程吧!
|
26天前
|
存储 数据采集 人工智能
Python编程入门:从零基础到实战应用
本文是一篇面向初学者的Python编程教程,旨在帮助读者从零开始学习Python编程语言。文章首先介绍了Python的基本概念和特点,然后通过一个简单的例子展示了如何编写Python代码。接下来,文章详细介绍了Python的数据类型、变量、运算符、控制结构、函数等基本语法知识。最后,文章通过一个实战项目——制作一个简单的计算器程序,帮助读者巩固所学知识并提高编程技能。