1000条豆瓣评论告诉你电影《四海》怎样

简介: 1000条豆瓣评论告诉你电影《四海》怎样

春节8部影片集结——《水门桥》、《狙击手》、《奇迹·笨小孩》、《四海》、《这个杀手不太冷静》,《喜羊羊与灰太狼之筐出未来》《熊出没·重返地球》和《小虎墩大英雄》,今天,我们用python爬虫看一下韩寒导演的新作《四海》的评价怎样?


豆瓣评分5.6分:

爬一下评论看看,具体代码如下:


import pandas as pd import requestsimport bs4import timeimport randomdef crawl(url):    headers={    'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36',    'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',    'Cookie':'douban-fav-remind=1; gr_user_id=7192bf1b-dff1-4d4e-b442-198662a6e796; bid=bLrpSuzeKFg; _vwo_uuid_v2=DA05DCADC910BEDC1D1D3D0773318CF78|c22091fa3bd072eb5c0220641c8b64d8; ll="118159"; __utma=30149280.361671231.1587465102.1621428340.1643877464.15; __utmc=30149280; __utmz=30149280.1643877464.15.1.utmcsr=baidu|utmccn=(organic)|utmcmd=organic; ap_v=0,6.0; _pk_ref.100001.4cf6=["","",1643877472,"https://www.douban.com/search?q=%E5%9B%9B%E6%B5%B7"]; _pk_ses.100001.4cf6=*; __utma=223695111.48667557.1599446059.1618665220.1643877472.7; __utmb=223695111.0.10.1643877472; __utmc=223695111; __utmz=223695111.1643877472.7.1.utmcsr=douban.com|utmccn=(referral)|utmcmd=referral|utmcct=/search; __gads=ID=6d9ae20d05952062-22b28f7572d000f1:T=1643877472:RT=1643877472:S=ALNI_Maf1NOnNSyULUase9Tc0w3ne8oDGg; __utmt=1; __utmb=30149280.4.10.1643877464; dbcl2="253523217:dPbRGm5Pixk"; ck=SBVj; push_noty_num=0; push_doumail_num=0; _pk_id.100001.4cf6=ae0e18afc045976b.1599446058.7.1643879806.1618665220.'    }    html=requests.get(url,headers=headers)    soup=bs4.BeautifulSoup(html.text)    data=[]    web_name=soup.select('span.comment-info > a')    short_text=soup.select('div.comment > p > span.short')    for i,j in zip(web_name,short_text):        name=i.get_text()        text=j.get_text()        #保存一版只带评论的txt文件        with open('<四海>影评.txt','a+') as f:            f.write(text)    f.close()    return(data)
for i in range(0,250):    #建立一个空的DataFrame    inidata=pd.DataFrame()     url=f'https://movie.douban.com/subject/35337517/comments?start={i*20}&limit=20&status=P&sort=new_score'    print(url)    time.sleep(random.random())    crawl(url)

爬取结果为:

做个词云:


呃,词云评论里最多的词句居然是:韩寒、飞驰人生。好吧,果然都是导演、演员光环照耀这部电影,5.6的评分也算中肯,您觉得呢?

相关文章
|
人工智能 安全 程序员
计算机专业必看的几部电影
这些电影涉及网络安全、互联网创业、编程挑战、社会工程学、科技巨头的创业故事和复杂系统逻辑,可以激发对计算机科学的兴趣并提供对未来科技发展的见解。
292 1
|
存储 XML NoSQL
KV 存储那些事儿
开发中,我们总会需要存储些 KV 数据,虽然看上去简单,但考虑因素也是很多的,实现手段也就各有差异。今天,我们就来看看 Android 目前有哪些 KV 库可以供我们使用,以及其有哪些优缺点。
583 0
|
缓存 JavaScript 数据可视化
echarts在vue3中的使用——其他页面跳转回echarts图表页面时,不显示图表的问题
echarts在vue3中的使用——其他页面跳转回echarts图表页面时,不显示图表的问题
947 0
|
Shell
mac 使用code命令打开VSCode
我们在mac的终端可以使用 open .打开文件夹 如果我们想用vs-code打开文件夹,用的命令是 code .,不过你得先按照code 安装code:打开VSCode –> command+shift+p –> 输入shell command –...
5546 0
|
JSON API 数据格式
豆瓣电影api系列
豆瓣电影api系列
豆瓣电影api系列
|
弹性计算 负载均衡 监控
jemeter压测【2万用户每秒5次请求在30秒内处理完请求】(二)
jemeter压测【2万用户每秒5次请求在30秒内处理完请求】
328 0
|
SQL 缓存 Java
SpringBoot系列教程JPA之update使用姿势
上面两篇博文拉开了jpa使用姿势的面纱一角,接下来我们继续往下扯,数据插入db之后,并不是说就一层不变了,就好比我在银行开了户,当然是准备往里面存钱了,有存就有取(特别是当下银行利率这么低还不如买比特币屯着,截止19年6月22日,btc已经突破1.1w$,可惜没钱买😭)这就是我们今天的主题,数据更新--update的使用姿势
1320 0
SpringBoot系列教程JPA之update使用姿势
|
11月前
|
运维 监控 Linux
BPF及Linux性能调试探索初探
BPF技术从最初的网络数据包过滤发展为强大的系统性能优化工具,无需修改内核代码即可实现实时监控、动态调整和精确分析。本文深入探讨BPF在Linux性能调试中的应用,介绍bpftune和BPF-tools等工具,并通过具体案例展示其优化效果。
467 14
|
12月前
|
机器学习/深度学习 人工智能 搜索推荐
AI与娱乐产业:电影制作的新工具
随着科技的发展,人工智能(AI)逐渐渗透到电影制作中,带来了前所未有的创新。本文探讨了AI在剧本创作、场景构建、特效制作、动作捕捉、音频处理、剪辑及市场调研等领域的应用,以及其对提升效率、激发创意和拓宽视野的影响,展望了AI在未来电影产业中的重要作用。
|
12月前
|
数据挖掘 Python
DrissionPage实战之采集猫眼电影top100榜
在信息化时代,数据的重要性日益凸显,特别是在充满活力的电影行业。猫眼电影作为中国领先的电影票务平台,提供了丰富的电影信息和用户评价,成为研究电影市场趋势的重要数据源。通过Python的DrissionPage库抓取猫眼电影Top 100榜单,不仅能够帮助影迷了解热门影片,还为制片方、市场分析师和投资者提供了宝贵的市场洞察。此项目通过自动化脚本定期更新数据,分析市场变化,助力精准决策。
297 0