用Python来看看网友是如何在《外卖平台销量第一的炸鸡店有多脏》的热搜下评论的!

简介: 大家好,我是志斌~今天志斌在微博上看到一条关于炸鸡的热搜。

大家好,我是志斌~


今天志斌在微博上看到一条关于炸鸡的热搜。


69.png


说实话,当时看到这条热搜时,志斌顿时就觉得自己之前吃的炸鸡好像并不是那么的香了!


然后志斌爬取了首条微博下的所有评论,来看看大家都是怎么评论这件事的~


01数据采集


志斌在之前的两篇文章中,详细的介绍了如何获取微博评论,有兴趣的读者可以看看这两篇文章批量爬取不同微博下的评论!爬取微博下全部评论数据~。这里志斌直接展示核心代码了,代码如下:


for page in range(1,10000):
  if page == 1 :
      params = (
          ('id', '4654152979845247'),
          ('mid', '4654152979845247'),
          ('max_id_type', '0'),
      )
  #s = requests.Session()
  response = requests.get('https://m.weibo.cn/comments/hotflow', headers=headers, params=params)
  a = response.json()['data']['max_id']
  b = response.json()['data']['max_id_type']
  for i in response.json()['data']['data']:
      pinglunshijian = i['created_at']
      neirong = re.sub(r'<[^>]*>', '', i['text'])
      id = i['user']['id']
      yonghumingcheng = i['user']['screen_name']
      with open(r'71.txt', 'a', encoding='utf-8') as f:
          f.write(f'{neirong}\n')
  params = (
      ('id', '4654152979845247'),
      ('mid', '4654152979845247'),
      ('max_id', str(a)),
      ('max_id_type', str(b)),
       )
  print(f'爬取第{page}页数据......')
  time.sleep(random.randint(1,3))


02词云图展示


我们一共获取了5235条数据,对这些数据进行词云图绘制,我们发现不吃、拉肚子和炸鸡等词较多。看来这些炸鸡店对于食品卫生安全这一块确实需要更大力度的监管!!!


70.png


志斌还点击了鲸视频发布的视频看了,确实很让忧心,并且视频里面还算了一下它的净利润非常高,在如此之高的利润之下,希望这些店铺能够重视食品卫生安全!!!



代码如下:


with open("华莱士_1.txt",encoding='utf-8') as f:
   job_title_1 = f.read()
job_title_2 = re.sub('华莱士', '', job_title_1)
job_title_3 = re.sub('喷射', '', job_title_2)
job_title_4 = re.sub('战士', '', job_title_3)
job_title_5 = re.sub('外卖', '', job_title_4)
job_title_6 = re.sub('再也', '', job_title_5)
contents_cut_job_title = jieba.cut(job_title_6)
contents_list_job_title = " ".join(contents_cut_job_title)
wc = WordCloud(stopwords=STOPWORDS.add("一个"), collocations=False,
              background_color="white",
              font_path=r"K:\苏新诗柳楷简.ttf",
              width=400, height=300, random_state=42,
              mask=imread('xin.jpg', pilmode="RGB")
              )
wc.generate(contents_list_job_title)
wc.to_file("推荐语.png")


03小结


1. 本文观点仅是作者个人观点,如有不当之处,请联系作者指正!

2. 也很感谢这些“卧底”,正是你们的努力,才让我们消费者的权益有所保障!

3. 本文仅做学习参考,不做它用。

相关文章
|
10天前
|
自然语言处理 算法 数据安全/隐私保护
item_review - Lazada 商品评论列表接口深度分析及 Python 实现
Lazada商品评论接口(item_review)可获取东南亚多国用户评分、评论内容、购买属性等数据,助力卖家分析消费者偏好、优化产品与营销策略。
|
11天前
|
JSON API 数据安全/隐私保护
Python采集淘宝评论API接口及JSON数据返回全流程指南
Python采集淘宝评论API接口及JSON数据返回全流程指南
JSON 监控 API
30 0
|
19天前
|
搜索推荐 算法 关系型数据库
基于python评论分析的商品推荐系统设计
本文介绍了多种开发技术,包括Python集成开发环境PyCharm、自然语言处理工具SnowNLP、关系型数据库MySQL、Python语言特性、Django Web框架以及协同过滤算法。内容涵盖各技术的基本功能、特点及其在实际开发中的应用,适用于初学者和开发者了解相关工具与框架的使用与优势。
|
2月前
|
存储 数据采集 数据可视化
Python爬取懂车帝/汽车之家评论并做竞品分析
Python爬取懂车帝/汽车之家评论并做竞品分析
|
2月前
|
API 开发工具 开发者
【干货满满】电商平台API接口用python调用脚本
这是一个支持淘宝、京东、拼多多、亚马逊等主流电商平台的通用 API 调用 Python 脚本框架,适配 doubao 使用。脚本封装了签名验证、请求处理、异常捕获及限流控制等核心功能,提供统一接口调用方式,便于开发者快速集成与扩展。
|
3月前
|
数据安全/隐私保护 Python Windows
抖音评论点赞协议工具,小红书快手哔哩哔哩微博评论协议,python评论协议代码
代码实现包含4个模块:主协议工具类、辅助工具函数、主程序入口和配置文件。这些代码模拟了主
|
3月前
|
JSON API 数据格式
Python采集京东商品评论API接口示例,json数据返回
下面是一个使用Python采集京东商品评论的完整示例,包括API请求、JSON数据解析
|
3月前
|
缓存 监控 API
1688平台开放接口实战:如何通过API获取店铺所有商品数据(Python示列)
本文介绍如何通过1688开放平台API接口获取店铺所有商品,涵盖准备工作、接口调用及Python代码实现,适用于商品同步与数据监控场景。

推荐镜像

更多