用Python对微博热搜做舆情分析~

简介: 大家好,我是志斌~今天志斌看微博热搜的时候,发现这样一条热搜。

大家好,我是志斌~


今天志斌看微博热搜的时候,发现这样一条热搜。


49.png



我寻思,这要真的改了,真的炸锅!所以志斌爬取了这条微博下的数据,进行了一个简单的舆情分析!


需要源码的同学,加志斌微信获取哈~


01数据采集


志斌在之前的两篇文章中,详细的介绍了如何获取微博评论,有兴趣的读者可以看看这两篇文章。这里志斌直接展示核心代码了,代码如下:

for page in range(1,10000):
  if page == 1 :
      params = (
          ('id', '4654152979845247'),
          ('mid', '4654152979845247'),
          ('max_id_type', '0'),
      )
  #s = requests.Session()
  response = requests.get('https://m.weibo.cn/comments/hotflow', headers=headers, params=params)
  a = response.json()['data']['max_id']
  b = response.json()['data']['max_id_type']
  for i in response.json()['data']['data']:
      pinglunshijian = i['created_at']
      neirong = re.sub(r'<[^>]*>', '', i['text'])
      id = i['user']['id']
      yonghumingcheng = i['user']['screen_name']
      with open(r'71.txt', 'a', encoding='utf-8') as f:
          f.write(f'{neirong}\n')
  params = (
      ('id', '4654152979845247'),
      ('mid', '4654152979845247'),
      ('max_id', str(a)),
      ('max_id_type', str(b)),
       )
  print(f'爬取第{page}页数据......')
  time.sleep(random.randint(1,3))


02可视化分析


我们来对这些数据进行可视化分析。本次绘图使用的是Excel和Tableau两款软件。


01 点赞数top10用户


50.png


我们发现椭圆圆子这个用户所发表的评论点赞数最多,有9.5w+,下面让我们看看它的评论是什么,竟然让用户这么喜欢。


51.png



这是一句纯吐槽的话,点赞数这么多,可能是因为发的时间早,或者是引起了老师们的共鸣。


02 评论日期分布


52.png


从图中我们可以清晰的看出,7.6号发表评论的人数最多,可能跟今天上热搜有关系的原因,毕竟上了热搜,曝光度就高了!


03 评论时间分布


53.png



对6号评论发布时间进行分析,我们发现19点发表的评论数量最多,我当时看到这条热搜的时候,基本也是这个时间,看来热搜对一个消息的影响还是很大的。


04 词云图


54.png


通过词云图可以看出,人们围绕这寒暑假这个词讨论的非常热烈,学生和取消、行业等词也被大量提及,我翻了翻评论,发现大部分人都是不想取消的。当然志斌也觉得不要取消。


03小结


1. 通过分析我们可以看出,热搜对每条微博的影响是巨大的。

2. 大家都不太愿意取消寒暑假。

3. 本文仅供学习参考,不做它用。

4. 需要源码的同学,加志斌微信获取哈~

相关文章
|
3月前
|
数据采集 存储 自然语言处理
基于Python的微博热点李佳琦忒网友话题的评论采集和情感分析的方法,利用情感分析技术对评论进行情感倾向性判断
本文介绍了一种基于Python的方法,用于采集微博热点话题下的评论数据,并运用情感分析技术对这些评论进行情感倾向性判断,进而通过统计分析和可视化技术展示网友对特定话题的情感态度,对品牌或个人形象管理、用户需求发现、舆情监测和危机管理等方面具有重要价值。
基于Python的微博热点李佳琦忒网友话题的评论采集和情感分析的方法,利用情感分析技术对评论进行情感倾向性判断
|
3月前
|
机器学习/深度学习 数据采集 算法
【python】python基于微博互动数据的用户类型预测(随机森林与支持向量机的比较分析)(源码+数据集+课程论文)【独一无二】
【python】python基于微博互动数据的用户类型预测(随机森林与支持向量机的比较分析)(源码+数据集+课程论文)【独一无二】
|
4月前
|
自然语言处理 算法 安全
Python实现贝叶斯算法疫情微博评论情感分析
Python实现贝叶斯算法疫情微博评论情感分析
Python实现贝叶斯算法疫情微博评论情感分析
|
5月前
|
数据采集 存储 API
用Python打造你的微博热搜追踪器
在当今信息爆炸的时代,获取最新、最热门的信息成为了许多人的日常需求。微博热搜榜作为反映社会热点和公众关注焦点的重要窗口,其信息价值不言而喻。本文将介绍一个实用的Python爬虫程序,它能够自动爬取微博热搜榜的信息,并通过邮件的形式将这些信息发送给用户,帮助用户及时了解社会动态,把握热点趋势。
|
6月前
|
监控 数据可视化 NoSQL
Python基于Flask的高校舆情分析,舆情监控可视化系统
Python基于Flask的高校舆情分析,舆情监控可视化系统
139 0
|
6月前
|
数据采集 存储 数据可视化
微博数据可视化分析:利用Python构建信息图表展示话题热度
微博数据可视化分析:利用Python构建信息图表展示话题热度
|
6月前
|
Python 自然语言处理 Java
Python每日一练(20230403) 随机正整数、微博热门话题、恢复二叉搜索树
Python每日一练(20230403) 随机正整数、微博热门话题、恢复二叉搜索树
53 0
Python每日一练(20230403) 随机正整数、微博热门话题、恢复二叉搜索树
|
数据可视化 JavaScript 前端开发
基于Python的微博大数据舆情分析,舆论情感分析可视化系统
基于Python的微博大数据舆情分析,舆论情感分析可视化系统
|
7天前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能浪潮下的自我修养:从Python编程入门到深度学习实践
【10月更文挑战第39天】本文旨在为初学者提供一条清晰的道路,从Python基础语法的掌握到深度学习领域的探索。我们将通过简明扼要的语言和实际代码示例,引导读者逐步构建起对人工智能技术的理解和应用能力。文章不仅涵盖Python编程的基础,还将深入探讨深度学习的核心概念、工具和实战技巧,帮助读者在AI的浪潮中找到自己的位置。
|
7天前
|
机器学习/深度学习 数据挖掘 Python
Python编程入门——从零开始构建你的第一个程序
【10月更文挑战第39天】本文将带你走进Python的世界,通过简单易懂的语言和实际的代码示例,让你快速掌握Python的基础语法。无论你是编程新手还是想学习新语言的老手,这篇文章都能为你提供有价值的信息。我们将从变量、数据类型、控制结构等基本概念入手,逐步过渡到函数、模块等高级特性,最后通过一个综合示例来巩固所学知识。让我们一起开启Python编程之旅吧!