selenium滑块解锁实现的研究

简介: 本文介绍了如何应对滑块解锁验证,这是一种常见的网站防爬策略。首先,需获取滑块及背景元素,计算偏移量,然后使用`selenium`的`actionChains`模拟滑动。通过缓动函数如`ease_out_quart`创建滑动轨迹,以增加真实性。然而,某些网站的滑块验证极其复杂,可能需要人工智能解决。此外,还讨论了使用JavaScript进行浏览器页面滚动,包括对整个页面和特定元素内滚动条的滚动操作。

滑块解锁

该问题主要源于各个平台的登录验证或者针对爬虫或selenium的一种防范手段。由于各个网站的防爬技术的提高,常规selenium似乎无法通过滑块验证,以下提供普遍的滑块验证思路,以供参考:

  • 获取滑块本身的元素以及滑块所在长条的元素
  • 根据滑块元素的size和所在矩形元素的size便能得到滑块的偏移量
  • 使用selenium库中的actionChains中的click_and_holemove_by_offset来控制滑块行动
根据滑块本身的大小以及承载滑块的div的大小来获取偏移量offx
    slide1_back = self.find_ele_is_presence(_slide1_back_locate)
    slide1_span = self.find_ele_is_presence(_slide1_span_locate)
    获取滑块的起始坐标location
    start_location = slide1_span.location
    # 获取滑块所在长条的长宽大小
    background_size = slide1_back.size
    4.滑块的滑动范围[开始位置的横坐标减去滑片的宽度],由于是平移所以纵坐标没有变化
    x_location = background_size["width"] - start_location["x"]
    y_location = start_location["y"]
  • 然后通过对滑动轨迹:即一定时间内滑动的偏移量的变化,来模拟真人操作,试图通过检测

def ease_out_quad(x):
    return 1 - (1 - x) * (1 - x)


def ease_out_quart(x):
    return 1 - pow(1 - x, 4)


def ease_out_expo(x):
    if x == 1:
        return 1
    else:
        return 1 - pow(2, -10 * x)


def get_tracks(distance, seconds):
    """
    :param distance: offset
    :param seconds: 拉动时间
    :return:
    """
    tracks = [0]
    offsets = [0]
    # print("np_value:", np.arange(0.0, seconds, 0.1))
    for t in np.arange(0.0, seconds, 0.1):
        offset = round(ease_out_quart(t / seconds) * distance)
        tracks.append(offset - offsets[-1])
        offsets.append(offset)
    return offsets, tracks

结论

遗憾的是,有些网站的滑块检测条件极为苛刻又难以捉摸,即使使用了随机暂停,加速度变化等操作来模拟真人滑动,还是无法通过检测。疑似要通过人工智能的方式来解决。

浏览器页面滚动

使用JS进行滚动

因为一般滚动条都不作为单独的元件出现,而是附庸在某个divtable上,当这些元件展示内容过多时便会自动出现滚动条,所以难以通过selenium定位然后actionChains调用方法进行拖拽的方式控制页面滚动,需要通过JS来完成对滚动条的操作。

常见JS

  • 针对整个页面进行滚动

def test_scroll_to():
    chromeOptions = webdriver.ChromeOptions()
    chromeOptions.add_argument('--start-maximized')
    driver = webdriver.Chrome(chromeOptions)

    driver.get('https://www.jd.com/')
    n=1
    while True:
        # driver.execute_script(f"document.body.scrollTop = {100*n};")
        driver.execute_script(f"window.scrollTo({(n-1)*50}, {n*50})")
        n+=1
  • 针对单个元素的内嵌滚动条进行滚动

```python

document.querySelector('.page-content').scrollTo(0,300)

document.querySelector('.ant-table-content').scrollTo(-100,0)
通过定位到存在内嵌滚动条的元件,然后使用scrollTo(x,y)进行滚动。

相关文章
|
23天前
|
Java 测试技术 Python
《手把手教你》系列基础篇(八十)-java+ selenium自动化测试-框架设计基础-TestNG依赖测试-番外篇(详解教程)
【6月更文挑战第21天】本文介绍了TestNG中测试方法的依赖执行顺序。作者通过一个实际的自动化测试场景展示了如何设计测试用例:依次打开百度、搜索“selenium”、再搜索“selenium+java”。代码示例中,`@Test`注解的`dependsOnMethods`属性用于指定方法间的依赖,确保执行顺序。如果不设置依赖,TestNG会按方法名首字母排序执行。通过运行代码,验证了依赖关系的正确性。
41 4
|
3天前
|
设计模式 测试技术 Python
《手把手教你》系列基础篇(九十二)-java+ selenium自动化测试-框架设计基础-POM设计模式简介(详解教程)
【7月更文挑战第10天】Page Object Model (POM)是Selenium自动化测试中的设计模式,用于提高代码的可读性和维护性。POM将每个页面表示为一个类,封装元素定位和交互操作,使得测试脚本与页面元素分离。当页面元素改变时,只需更新对应页面类,减少了脚本的重复工作和维护复杂度,有利于团队协作。POM通过创建页面对象,管理页面元素集合,将业务逻辑与元素定位解耦合,增强了代码的复用性。示例展示了不使用POM时,脚本直接混杂了元素定位和业务逻辑,而POM则能解决这一问题。
23 6
|
1天前
|
设计模式 Java 测试技术
《手把手教你》系列基础篇(九十四)-java+ selenium自动化测试-框架设计基础-POM设计模式实现-下篇(详解教程)
【7月更文挑战第12天】在本文中,作者宏哥介绍了如何在不使用PageFactory的情况下,用Java和Selenium实现Page Object Model (POM)。文章通过一个百度首页登录的实战例子来说明。首先,创建了一个名为`BaiduHomePage1`的页面对象类,其中包含了页面元素的定位和相关操作方法。接着,创建了测试类`TestWithPOM1`,在测试类中初始化WebDriver,设置驱动路径,最大化窗口,并调用页面对象类的方法进行登录操作。这样,测试脚本保持简洁,遵循了POM模式的高可读性和可维护性原则。
11 2
|
5天前
|
XML Java 测试技术
《手把手教你》系列基础篇(九十一)-java+ selenium自动化测试-框架设计基础-Logback实现日志输出-下篇(详解教程)
【7月更文挑战第9天】在Java项目中,使用Logback配置可以实现日志按照不同包名输出到不同的文件,并且根据日志级别分开记录。
20 4
|
6天前
|
XML Java 测试技术
《手把手教你》系列基础篇(九十)-java+ selenium自动化测试-框架设计基础-Logback实现日志输出-中篇(详解教程)
【7月更文挑战第8天】这篇教程介绍了如何使用Logback将Java应用的日志输出到文件中。首先,通过创建`logback.xml`配置文件,设置`FileAppender`来指定日志文件路径和格式。然后,提供了一个`RollingFileAppender`的例子,用于每日生成新的日志文件并保留一定天数的历史记录。文中包含配置文件的XML代码示例,并展示了控制台输出和生成的日志文件内容。教程最后提到了一些可能遇到的问题及解决建议。
15 0
《手把手教你》系列基础篇(九十)-java+ selenium自动化测试-框架设计基础-Logback实现日志输出-中篇(详解教程)
|
11天前
|
XML 测试技术 数据格式
《手把手教你》系列基础篇(八十五)-java+ selenium自动化测试-框架设计基础-TestNG自定义日志-下篇(详解教程)
【7月更文挑战第3天】TestNG教程展示了如何自定义日志记录。首先创建一个名为`TestLog`的测试类,包含3个测试方法,其中一个故意失败以展示日志。使用`Assert.assertTrue`和`Reporter.log`来记录信息。接着创建`CustomReporter`类,继承`TestListenerAdapter`,覆盖`onTestFailure`, `onTestSkipped`, 和 `onTestSuccess`,在这些方法中自定义日志输出。
27 6
|
7天前
|
Java 关系型数据库 测试技术
《手把手教你》系列基础篇(八十九)-java+ selenium自动化测试-框架设计基础-Logback实现日志输出-上篇(详解教程)
【7月更文挑战第7天】Apache Log4j2的安全漏洞促使考虑使用logback作为替代的日志框架。Logback由log4j创始人设计,提供更好的性能,更低的内存使用,并且能够自动重载配置文件。它分为logback-core、logback-classic(实现了SLF4J API)和logback-access(用于Servlet容器集成)三个模块。配置涉及Logger、Appender(定义日志输出目的地)和Layout(格式化日志)。
15 1
|
10天前
|
Java 测试技术 Apache
《手把手教你》系列基础篇(八十六)-java+ selenium自动化测试-框架设计基础-Log4j实现日志输出(详解教程)
【7月更文挑战第4天】Apache Log4j 是一个广泛使用的 Java 日志框架,它允许开发者控制日志信息的输出目的地、格式和级别。Log4j 包含三个主要组件:Loggers(记录器)负责生成日志信息,Appenders(输出源)确定日志输出的位置(如控制台、文件、数据库等),而 Layouts(布局)则控制日志信息的格式。通过配置 Log4j,可以灵活地定制日志记录行为。
27 4
|
21天前
|
Java 测试技术 Python
《手把手教你》系列基础篇(八十一)-java+ selenium自动化测试-框架设计基础-TestNG如何暂停执行一些case(详解教程)
【6月更文挑战第22天】本文介绍了如何在TestNG中不执行特定测试用例。当部分模块未准备好时,可以通过以下方式暂停测试:③使用`@Test(enabled=false)`注解来禁用测试用例。作者提供了一个Java Selenium自动化测试的示例,展示如何通过修改`enabled`参数控制测试方法的执行。代码中,`testSearch2()`方法被禁用,因此在测试运行时不执行。文章还包含了测试报告和执行过程的截图。
39 7

热门文章

最新文章