进一步防止 Selenium 被检测——如何防止浏览器用新标签页打开链接？-阿里云开发者社区

进一步防止 Selenium 被检测——如何防止浏览器用新标签页打开链接？

2023-05-20 589

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 进一步防止 Selenium 被检测——如何防止浏览器用新标签页打开链接？

摄影：产品经理产品经理背着我吃日料

在文章：（最新版）如何正确移除Selenium中的 window.navigator.webdriver中，我们讲到了Page.addScriptToEvaluateOnNewDocument这个方法，它可以让当前标签页打开的所有网页，在网页内容加载之前执行一段 JavaScript 代码，从而防止网站检测到window.navigator.webdriver属性。

但有些网站，点击了它的页面超链接以后，会自动以新的标签页打开，这种情况下就无法使用上面提到的技巧了。

为了解决这个问题，我们必须设法让当前页面的所有a标签涉及到的链接，都能在当前标签页打开。

要解决这个问题实际上非常简单，我们只需要知道一点点HTML知识和 JavaScript 的知识即可。如果要用一个a标签的链接在当前页面打开，我们只需要设置它的target属性值为_self。

现在我们需要用 JavaScript 把当面页面上的所有a标签的target属性值全部改成_self。

以知乎为例，我们打开知乎的首页，如下图所示：

现在点击上面的任何一个问题，都会以新标签页打开，如下图所示：

现在我们回到原来的首页，打开开发者工具的Console选项卡，如下图所示：

执行如下两行 JavaScript:

let a_list = document.getElementsByTagName('a')
[...a_list].map(a => {a.setAttribute('target', '_self')})

运行效果如下图所示：

现在，我们再次点击页面上的任意一个问题，就会发现，你可以直接在当前标签页打开了。

使用这个方法有4个地方需要注意：

不适用于通过 JavaScript 的 window.open()函数打开新网址的情况
对于<form>标签的表单提交，也可以设置target="_self"属性。
必须等页面完全加载完成才能执行这两行 JavaScript 语句。如果执行语句以后，页面通过 Ajax 或者其他途径又加载了新的 HTML，那么需要重新执行。
每次打开新的链接以后，需要再次执行这两行语句。

这个方法可以与本文开始提到的那篇文章中的方法结合起来使用。首先通过Page.addScriptToEvaluateOnNewDocument让当前标签页的window.navigator.webdriver属性消失，等页面完全加载完成以后，再通过driver.execute_script()运行本文讲到的两行 JavaScript 代码，强迫网页在当前标签页打开新的链接。

进一步防止 Selenium 被检测——如何防止浏览器用新标签页打开链接？

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

进一步防止 Selenium 被检测——如何防止浏览器用新标签页打开链接？

热门文章

最新文章

相关电子书