Python + Selenium + Chrome Driver 自动化点击+评论+刷弹幕(仅供学习)

简介: Python + Selenium + Chrome Driver 自动化点击+评论+刷弹幕(仅供学习)

Python + Selenium + Chrome Driver 自动化点击 评论 刷弹幕


首先说明,这篇博文仅供学习!仅供学习!仅供学习!


不要拿去做其他事,封号概不负责!!!


突发奇想


首先先说明刷评论或者阅读量是不行的,当我们认同这一点以后,我们再一起讨论一下技术


对于这个自动化评论来说,我有时候在想,是否有什么方法,可以自动发弹幕或者对一些博文进行自动评论,有什么方法呢


刷阅读量


首先可以介绍一下刷阅读量,在CSDN的博文中,我们会发现一个规律。CSDN博客并没有反爬虫的机制,因此,我们可以利用爬虫来增加自己的博文阅读量,但是需要让我们的爬虫“友好”一些,如果简单的访问,还是不行的,因为CSDN还是有设置两次访问的最短时间间隔的,因此,我们访问博文的时间间隔不能太短,太短的话阅读量是不会增加的。


除此之外,我也有在想,若想不受时间限制,是否可以轮换使用多个代理,也就是换自己的IP(假装用其他电脑进行访问),有可能这样一访问就是一个阅读量,如果大家感兴趣,下次可以做一个介绍

自动化评论


除了刷阅读量之外,我还在思考,有什么方法,可以自动化点击,自动化刷弹幕


奇思妙想


以CSDN为例的话,我一开始在想,有什么方法呢,但是出现一个问题,无法登录CSDN的账号,因为评论需要CSDN的账号,这一部分可能能够使用cookie,但是还是不行,如果我们能看网页源代码的时候,我们会发现,现在的CSDN的评论是JavaScript写的,所以是人机交互的,需要一个点击才能显示评论框,并且有时候是有ajex请求的


接着我就开始思考了,首先想到的就是利用selenium进行自动化操作,但是登录的时候,我人为进行登录,但是由于这是驱动器的Chrome,我人为滑也是不能通过验证的,我当时还发布了一个问题,这个问题当时烦恼了我很久



6a5fa46d6ce8454eb7df5be82ae7060b.png

结果,有个专家的回答,给了我一个灵感,可以用Selenium 连接已经打开的浏览器,这时候不就可以不用登录嘛



10aefd97f6fb44d78545386cbea2be88.png


这是一个非常聪明的想法,然后我就开始寻找资料,开始尝试和验证想法


环境配置


安装Selenium 库


可以简单介绍一下,Selenium 是为浏览器自动化(Browser Automation)需求所设计的一套工具集合,让程式可以直接驱动浏览器进行各种网站操作。

首先,我们需要安装我们的selenium库

其实方法是很简单的,只需要打开我们的控制台

pip install selenium


我当前下载的是4.4.3版本,之前有4.0之前的版本,有一些函数就有问题,不过这都是小事


配置Chromedriver

我们可以根据https://blog.csdn.net/kun_csdn/article/details/124267821这篇博客,描述的去进行配置我们的chromedriver、


chrome驱动器地址: http://npm.taobao.org/mirrors/chromedriver/


对于程序来说,如何让python代码找到驱动器,往往有两种方法


设置系统路径,这个在博客中有写。

或者代码设置,这一部分,就是在代码中加入驱动器的路径

如果配置成功,运行以下代码是成功的。

from selenium import webdriver
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
import time
time.sleep(5)
driver.quit()

这样就会自动启动一个浏览器,并且会自动打开百度页面

如果出现问题,要不然就是浏览器驱动版本未匹配,要不然就是系统路径没有设置好,这里就需要通过代码设置,在代码中加入驱动器的路径

所以这时候,我们就需要指定驱动器的绝对路径

driver = webdriver.Chrome(r'C:\xxx\chromedriver.exe')


如果遇到这种问题,selenium.common.exceptions.WebDriverException: Message: unknown Error: cannot find Chrome binary,可以参考以下博客 https://blog.csdn.net/weixin_43832437/article/details/118191412


自动化测试


到这一部分,我们就可以自动得到,模拟人自动打开浏览器,可以自动刷网页,这也是一个刷阅读量的方法;除此之外,也可以自动搜索,自动进行淘宝购物等等。


Selenium 库的主要函数介绍


现在已经对环境配置完成了,那我们就可以开始进行自动化测试了,在开始之前,我们需要明白selenium的一些函数和操作,我们前面有说明,selenium 是一款十分强大的Web应用自动化框架,我们可以通过它来自动操控浏览器。操控浏览器的实质是操控浏览器的界面元素,因此定位元素是使用selenium的关键,selenium中通过find_element方法来完成定位。


1.find_element的三种用法


(1)通过webdriver对象的find_element(“属性名”,“属性值”)

  • 如1:我们要定位一个属性id,值为"wang"的元素


find_element("id","wang")


如2:我们要定位一个属性class,值为"plant"的元素


find_element("class name","plant")


(2)通过webdriver对象的find_element_by_xx(" ")(在selenium的4.0版本中此种用法已经抛弃,不推荐使用)

如:定位id为username,class_name为password,tag_name为input的元素

find_element_by_id("username")
find_element_by_class_name("password")
find_element_by_tag_name("input")

但是这种方法,现在使用已经会报错,因为已经抛弃了


(3)通过webdriver模块中的By,以指定方式定位元素(这种方式才是比较常用的)


导入模块:from selenium.webdriver.common.by import By


如:定位id为username,class_name为password,tag_name为input的元素

from selenium.webdriver.common.by import By
find_element(By.ID,"username")
find_element(By.CLASS_NAME,"password")
find_element(By.TAG_NAME,"input")

2.find_element()和find_elements()的区别


(1)find_element()的返回结果是一个WebElement对象,如果符合条件的有多个,默认返回找到的第一个,如果没有找到则抛出NoSuchElementException异常。


(2)find_elements()的返回结果是一个包含所有符合条件的WebElement对象的列表,如果未找到,则返回一个空列表。


如果想详细学习,也可以看看这篇博客 https://blog.csdn.net/qq_54219272/article/details/123338773 ,已经包含了大部分的函数和方法。


解析网页源代码


首先,我们需要解析一下网页源代码,找到我们的element是什么,这样才能对浏览器进行操作


我的思路,就是点击下面的这几个图标,点击评论就会出现我们的评论框


6ab15b646b744fa39b7dfc0fefcb715f.png

这个是JavaScript人机互动出来的,这里需要用click进行点击即可


573b84e46aca42c695e2c72141861569.png


当出来以后,我们就可以找到评论框的元素,然后进行,输入我们提前设置好的文本,也就是我们的字符串,这一部分可以用send_keys进行输入

最后我们再找到评论这个按钮的元素,模拟点击即可,就可以完成整个流程


driver.find_element(By.CSS_SELECTOR,"[class='btn-comment btn-comment-input']").click() # 点击评论


这一部分代码可能不太好完整给出来,如果有意愿付费学习等等可以联系我


出现的问题和改进的一些方法


首先,在我们运行的时候,我们会发现一个问题,如果每次打开一个浏览器之后,我们需要首先手动进行登录,那是否可以直接控制一个已经登录的浏览器呢,或者说带cookie的浏览器呢。实际上是有的,之后的博客会介绍一下,如果使Chrome带配置项启动


其次,如果评论的比较频繁,也会被CSDN识别进行封号,并且CSDN现在也有查看无意义化的评论,希望有更多的高质量评论,不过这些是可以根据我们语料库进行判断然后选取的。


总结


我的代码框架是非常完善的,由于我们需要选取一定的好的博文进行评论

首先去排行榜,爬取排行榜上的博文的文章(包括全站排行榜,以及各个领域的排行榜)

得到各个网址之后,调用selenium来访问这些网页

自动化测试当前网页,进行评论,评论内容是使用自己设置的语料库进行随机选择。

等待一段时间以后,再进行评论下一个网页

设置评论的次数,评论达到阈值后,就退出浏览器。

最后再次说明


这篇博文仅供学习!仅供学习!仅供学习!

相关文章
|
12天前
|
运维 数据安全/隐私保护 Python
Python基于telnetlib模块实现交换机全面巡检自动化运维项目
Python基于telnetlib模块实现交换机全面巡检自动化运维项目
46 14
|
3天前
|
JSON 中间件 数据处理
实践出真知:通过项目学习Python Web框架的路由与中间件设计
【7月更文挑战第19天】探索Python Web开发,掌握Flask或Django的关键在于理解路由和中间件。路由连接URL与功能,如Flask中@app.route()定义请求响应路径。中间件在请求处理前后执行,提供扩展功能,如日志、认证。通过实践项目,不仅学习理论,还能提升构建高效Web应用的能力。示例代码展示路由定义及模拟中间件行为,强调动手实践的重要性。
|
5天前
|
测试技术 API Android开发
《手把手教你》系列基础篇(九十七)-java+ selenium自动化测试-框架设计篇-Selenium方法的二次封装和页面基类(详解教程)
【7月更文挑战第15天】这是关于自动化测试框架中Selenium API二次封装的教程总结。教程中介绍了如何设计一个支持不同浏览器测试的页面基类(BasePage),该基类包含了对Selenium方法的二次封装,如元素的输入、点击、清除等常用操作,以减少重复代码。此外,页面基类还提供了获取页面标题和URL的方法。
15 2
|
6天前
|
Web App开发 XML Java
《手把手教你》系列基础篇(九十六)-java+ selenium自动化测试-框架之设计篇-跨浏览器(详解教程)
【7月更文挑战第14天】这篇教程介绍了如何使用Java和Selenium构建一个支持跨浏览器测试的自动化测试框架。设计的核心是通过读取配置文件来切换不同浏览器执行测试用例。配置文件中定义了浏览器类型(如Firefox、Chrome)和测试服务器的URL。代码包括一个`BrowserEngine`类,它初始化配置数据,根据配置启动指定的浏览器,并提供关闭浏览器的方法。测试脚本`TestLaunchBrowser`使用`BrowserEngine`来启动浏览器并执行测试。整个框架允许在不同浏览器上运行相同的测试,以确保兼容性和一致性。
16 3
|
11天前
|
机器学习/深度学习 数据采集 算法
Python实现ISSA融合反向学习与Levy飞行策略的改进麻雀优化算法优化支持向量机回归模型(SVR算法)项目实战
Python实现ISSA融合反向学习与Levy飞行策略的改进麻雀优化算法优化支持向量机回归模型(SVR算法)项目实战
|
8天前
|
存储 Web App开发 Java
《手把手教你》系列基础篇(九十五)-java+ selenium自动化测试-框架之设计篇-java实现自定义日志输出(详解教程)
【7月更文挑战第13天】这篇文章介绍了如何在Java中创建一个简单的自定义日志系统,以替代Log4j或logback。
28 5
|
11天前
|
设计模式 测试技术 Python
《手把手教你》系列基础篇(九十二)-java+ selenium自动化测试-框架设计基础-POM设计模式简介(详解教程)
【7月更文挑战第10天】Page Object Model (POM)是Selenium自动化测试中的设计模式,用于提高代码的可读性和维护性。POM将每个页面表示为一个类,封装元素定位和交互操作,使得测试脚本与页面元素分离。当页面元素改变时,只需更新对应页面类,减少了脚本的重复工作和维护复杂度,有利于团队协作。POM通过创建页面对象,管理页面元素集合,将业务逻辑与元素定位解耦合,增强了代码的复用性。示例展示了不使用POM时,脚本直接混杂了元素定位和业务逻辑,而POM则能解决这一问题。
27 6
|
7天前
|
监控 jenkins 持续交付
Python进行自动化
【7月更文挑战第9天】 Python在自动化部署中发挥关键作用,提供如Fabric、Ansible、Docker SDK和Kubernetes Client等工具。自动化部署提高效率、减少错误,确保部署一致性和可控性。例如,Fabric库简化了远程服务器的部署任务,如在多台服务器上执行Git拉取和Docker容器启动。持续集成/部署(CI/CD)结合Jenkins和Fabric,实现代码变更自动构建、测试和部署。监控和持续改进是确保应用稳定性和质量的关键,通过定期回顾、度量分析以及有效监控系统来优化流程。
18 1
|
8天前
|
设计模式 Java 测试技术
《手把手教你》系列基础篇(九十四)-java+ selenium自动化测试-框架设计基础-POM设计模式实现-下篇(详解教程)
【7月更文挑战第12天】在本文中,作者宏哥介绍了如何在不使用PageFactory的情况下,用Java和Selenium实现Page Object Model (POM)。文章通过一个百度首页登录的实战例子来说明。首先,创建了一个名为`BaiduHomePage1`的页面对象类,其中包含了页面元素的定位和相关操作方法。接着,创建了测试类`TestWithPOM1`,在测试类中初始化WebDriver,设置驱动路径,最大化窗口,并调用页面对象类的方法进行登录操作。这样,测试脚本保持简洁,遵循了POM模式的高可读性和可维护性原则。
13 2
|
11天前
|
机器学习/深度学习 数据采集 算法
Python实现ISSA融合反向学习与Levy飞行策略的改进麻雀优化算法优化支持向量机分类模型(SVC算法)项目实战
Python实现ISSA融合反向学习与Levy飞行策略的改进麻雀优化算法优化支持向量机分类模型(SVC算法)项目实战

热门文章

最新文章