用Python来看看网友是如何在《外卖平台销量第一的炸鸡店有多脏》的热搜下评论的!

简介: 大家好,我是志斌~今天志斌在微博上看到一条关于炸鸡的热搜。

大家好,我是志斌~


今天志斌在微博上看到一条关于炸鸡的热搜。


69.png


说实话,当时看到这条热搜时,志斌顿时就觉得自己之前吃的炸鸡好像并不是那么的香了!


然后志斌爬取了首条微博下的所有评论,来看看大家都是怎么评论这件事的~


01数据采集


志斌在之前的两篇文章中,详细的介绍了如何获取微博评论,有兴趣的读者可以看看这两篇文章批量爬取不同微博下的评论!爬取微博下全部评论数据~。这里志斌直接展示核心代码了,代码如下:


for page in range(1,10000):
  if page == 1 :
      params = (
          ('id', '4654152979845247'),
          ('mid', '4654152979845247'),
          ('max_id_type', '0'),
      )
  #s = requests.Session()
  response = requests.get('https://m.weibo.cn/comments/hotflow', headers=headers, params=params)
  a = response.json()['data']['max_id']
  b = response.json()['data']['max_id_type']
  for i in response.json()['data']['data']:
      pinglunshijian = i['created_at']
      neirong = re.sub(r'<[^>]*>', '', i['text'])
      id = i['user']['id']
      yonghumingcheng = i['user']['screen_name']
      with open(r'71.txt', 'a', encoding='utf-8') as f:
          f.write(f'{neirong}\n')
  params = (
      ('id', '4654152979845247'),
      ('mid', '4654152979845247'),
      ('max_id', str(a)),
      ('max_id_type', str(b)),
       )
  print(f'爬取第{page}页数据......')
  time.sleep(random.randint(1,3))


02词云图展示


我们一共获取了5235条数据,对这些数据进行词云图绘制,我们发现不吃、拉肚子和炸鸡等词较多。看来这些炸鸡店对于食品卫生安全这一块确实需要更大力度的监管!!!


70.png


志斌还点击了鲸视频发布的视频看了,确实很让忧心,并且视频里面还算了一下它的净利润非常高,在如此之高的利润之下,希望这些店铺能够重视食品卫生安全!!!



代码如下:


with open("华莱士_1.txt",encoding='utf-8') as f:
   job_title_1 = f.read()
job_title_2 = re.sub('华莱士', '', job_title_1)
job_title_3 = re.sub('喷射', '', job_title_2)
job_title_4 = re.sub('战士', '', job_title_3)
job_title_5 = re.sub('外卖', '', job_title_4)
job_title_6 = re.sub('再也', '', job_title_5)
contents_cut_job_title = jieba.cut(job_title_6)
contents_list_job_title = " ".join(contents_cut_job_title)
wc = WordCloud(stopwords=STOPWORDS.add("一个"), collocations=False,
              background_color="white",
              font_path=r"K:\苏新诗柳楷简.ttf",
              width=400, height=300, random_state=42,
              mask=imread('xin.jpg', pilmode="RGB")
              )
wc.generate(contents_list_job_title)
wc.to_file("推荐语.png")


03小结


1. 本文观点仅是作者个人观点,如有不当之处,请联系作者指正!

2. 也很感谢这些“卧底”,正是你们的努力,才让我们消费者的权益有所保障!

3. 本文仅做学习参考,不做它用。

相关文章
|
1月前
|
数据采集 Web App开发 监控
高效爬取B站评论:Python爬虫的最佳实践
高效爬取B站评论:Python爬虫的最佳实践
|
20天前
|
存储 API 数据库
使用Python开发获取商品销量详情API接口
本文介绍了使用Python开发获取商品销量详情的API接口方法,涵盖API接口概述、技术选型(Flask与FastAPI)、环境准备、API接口创建及调用淘宝开放平台API等内容。通过示例代码,详细说明了如何构建和调用API,以及开发过程中需要注意的事项,如数据库连接、API权限、错误处理、安全性和性能优化等。
74 5
|
1月前
|
数据采集 存储 数据可视化
Python数据分析:揭秘"黑神话:悟空"Steam用户评论趋势
Python数据分析:揭秘"黑神话:悟空"Steam用户评论趋势
|
1月前
|
数据采集 存储 Web App开发
利用Python 的爬虫技术淘宝天猫销量和库存
使用 Python 爬虫技术获取淘宝天猫商品销量和库存的步骤包括:1. 安装 Python 和相关库(如 selenium、pandas),下载浏览器驱动;2. 使用 selenium 登录淘宝或天猫;3. 访问商品页面,分析网页结构,提取销量和库存信息;4. 处理和存储数据。注意网页结构可能变化,需遵守法律法规。
|
2月前
|
前端开发 数据可视化 API
Python实现智能家居设备的统一控制平台
【10月更文挑战第6天】 Python实现智能家居设备的统一控制平台
134 11
|
3月前
|
机器学习/深度学习 人工智能 算法
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
文本分类识别系统。本系统使用Python作为主要开发语言,首先收集了10种中文文本数据集("体育类", "财经类", "房产类", "家居类", "教育类", "科技类", "时尚类", "时政类", "游戏类", "娱乐类"),然后基于TensorFlow搭建CNN卷积神经网络算法模型。通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型,并保存为本地的h5格式。然后使用Django开发Web网页端操作界面,实现用户上传一段文本识别其所属的类别。
118 1
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
3月前
|
机器学习/深度学习 人工智能 算法
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台。果蔬识别系统,本系统使用Python作为主要开发语言,通过收集了12种常见的水果和蔬菜('土豆', '圣女果', '大白菜', '大葱', '梨', '胡萝卜', '芒果', '苹果', '西红柿', '韭菜', '香蕉', '黄瓜'),然后基于TensorFlow库搭建CNN卷积神经网络算法模型,然后对数据集进行训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地文件方便后期调用。再使用Django框架搭建Web网页平台操作界面,实现用户上传一张果蔬图片识别其名称。
70 0
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
4月前
|
自然语言处理 算法 数据挖掘
基于python豆瓣电影评论的情感分析和聚类分析,聚类分析有手肘法进行检验,情感分析用snownlp
本文介绍了一个基于Python的情感分析和聚类分析项目,使用snownlp库对豆瓣电影评论进行情感分析,并采用手肘法辅助K-means算法进行聚类分析,以探索评论中的不同主题和情感集群。
128 5
基于python豆瓣电影评论的情感分析和聚类分析,聚类分析有手肘法进行检验,情感分析用snownlp
|
4月前
|
数据采集 存储 自然语言处理
基于Python的微博热点李佳琦忒网友话题的评论采集和情感分析的方法,利用情感分析技术对评论进行情感倾向性判断
本文介绍了一种基于Python的方法,用于采集微博热点话题下的评论数据,并运用情感分析技术对这些评论进行情感倾向性判断,进而通过统计分析和可视化技术展示网友对特定话题的情感态度,对品牌或个人形象管理、用户需求发现、舆情监测和危机管理等方面具有重要价值。
基于Python的微博热点李佳琦忒网友话题的评论采集和情感分析的方法,利用情感分析技术对评论进行情感倾向性判断
|
4月前
|
机器学习/深度学习 自然语言处理 数据可视化
基于Python大数据的京东产品评论的情感分析的研究,包括snwonlp情感分析和LDA主题分析
本文探讨了基于Python大数据技术对京东产品评论进行情感分析的研究,涵盖了文本预处理、情感分类、主题建模等步骤,并运用了snwonlp情感分析和LDA主题分析方法,旨在帮助电商企业和消费者做出更明智的决策。
173 1
基于Python大数据的京东产品评论的情感分析的研究,包括snwonlp情感分析和LDA主题分析