Python、Selenium实现问卷星自动填写(内含适配个人问卷的方法)

简介: Python、Selenium实现问卷星自动填写(内含适配个人问卷的方法)

🌟效果预览


image.gif


🌟环境准备


selenium、payautogui安装


Selenium:用于自动化web应用程序测试。它提供了一组API和库,使开发人员能够以编程方式控制浏览器并执行各种操作,如模拟用户的点击、输入文本、获取元素属性、处理JavaScript弹窗等。Selenium最初是为浏览器自动化测试而设计的,但在实际应用中,它也可以用于数据挖掘、网页抓取和自动化任务等其他方面。

PyAutoGUI:用于自动化鼠标和键盘操作的Python库。它提供了一组功能丰富的API,可以模拟用户在屏幕上的鼠标移动、点击、滚动以及键盘按键的操作。PyAutoGUI可以帮助开发人员实现各种自动化任务,如自动化测试、屏幕录制、图像识别等。

pip install selenium
pip install pyautogui


WebDriver谷歌浏览器驱动安装


驱动下载地址:webdriver

注意找到本地浏览器对应的版本

903b8a8a791d8785a7b8462439f406ba_4f3d1843f0fc4747a78217f4123823b8.png


🌟具体代码


以下代码是单元题、矩阵多选题的代码,包含具体的代码注释。如果想修改成适用于个人问卷的代码,可参照定位元素方法的章节

# 引入相关模块
from selenium.webdriver.common.by import By
from selenium import webdriver
#随机数产生
import random 
#延时
import time
# 模拟人手,进行页面滚动
import pyautogui
####方法:题干————》选项####
#滚动方法,scroPx为滚动距离
def scrop(driver,scroPx):
  #滚动脚本
  js = "var q=document.documentElement.scrollTop=" + str(scroPx)
  #脚本执行
  driver.execute_script(js)
  #延时
  time.sleep(1)
#单选题
def single(driver):
  #页面中有10个单选题
  for j in range(1,11):
    #每个单选题所在的位置
    sinPro = driver.find_elements_by_css_selector(f'#div{j} > div.ui-controlgroup.column1')
    #每个单选题的答案进行遍历
    for answer in sinPro:
      #对应每个单选题的选项组合
      ansItem= answer.find_elements_by_css_selector('.ui-radio') 
      #随机点击选项
      random.choice(ansItem).click()
      #答题时间间隔
      time.sleep(random.randint(0,1))
#矩阵选择题,一个题
def juzhen(driver):
    #矩阵行数
    for i in range(1,6):
        #矩阵列数,
        index = random.randint(2, 6)
        #对应的每一个选项
        dan = driver.find_element_by_xpath(f"//tr[@id='drv8_{i}']/td[{index}]/a")
        #选择
        dan.click()
        time.sleep(random.randint(0, 1))
#脚本执行方法
def launch(nums):
    for i in range(0, nums):
        # 初始配置,问卷星地址
        url_survey = 'https://www.wjx.cn/vm/wY1vxPu.aspx'
        option = webdriver.ChromeOptions()
        option.add_experimental_option('excludeSwitches', ['enable-automation'])
        option.add_experimental_option('useAutomationExtension', False)
        # 本地下载的谷歌浏览器地址
        option.binary_location = r'C:\Program Files\Google\Chrome\Application\chrome.exe'
        # 下载好的Chrome驱动的地址
        driver = webdriver.Chrome(r"D:\chromedriver_win32\chromedriver.exe", options=option)
        driver.execute_cdp_cmd('Page.addScriptToEvaluateOnNewDocument',
                               {'source': 'Object.defineProperty(navigator, "webdriver", {get: () => undefined})'})
        # 启动要填写的地址
        driver.get(url_survey)
        #调用单选题方法
        single(driver)
        time.sleep(random.randint(0, 1))
        #涉及到多个矩阵题执行方法
        for k in range(4):
            method_name = f'juzhen{k}'
            method = globals()[method_name]
            method(driver)
        #调用滚动屏幕方法
        scrop(driver, 600) 
        #提交按钮
        driver.find_element_by_css_selector('#ctlNext').click()  # 找到提交的css并点击
        time.sleep(4)
        print('已经提交了{}次问卷'.format(int(i) + int(1)))
        time.sleep(4)
        driver.quit()#停止
  if __name__ == "__main__":
    #填写问卷次数
    launch(5)

🌟Selenium常用API


方法 描述
find_element_by_id('element_id') 通过元素的id属性查找元素
find_element_by_name('element_name') 通过元素的name属性查找元素
find_element_by_class_name('class') 通过元素的class属性查找元素
find_element_by_tag_name('tag') 通过元素的标签名查找元素
find_element_by_link_text('text') 通过链接文本查找超链接元素
find_element_by_partial_link_text('text') 通过部分链接文本查找超链接元素
find_element_by_xpath('xpath_expression') 通过XPath表达式查找元素
find_element_by_css_selector('css_selector') 通过CSS选择器查找元素
click() 点击元素
send_keys('text') 向元素发送文本内容
clear() 清空元素的内容
get('url') 打开指定的URL
current_url 获取当前页面的URL
title 获取当前页面的标题
back() 返回上一个浏览的页面
forward() 前进到下一个浏览的页面
refresh() 刷新当前页面
switch_to.frame('frame') 切换到指定的iframe
switch_to.default_content() 切换到默认的frame
switch_to.alert 处理 JavaScript 弹窗
execute_script('script') 在当前页面执行 JavaScript 代码

🌟如何定位元素


打开开发者工具,找到选项位置的具体代码,之后右击鼠标进行元素定位,点击copy复制到自己代码中即可。

4e03d3aa2a5dd7042ceb462b3fd463e8_137bc14c1e1d480a887486d296849d50.png


🌟写在最后


最后感谢大家对本文的阅读,如有不足之处还望在评论区指点或者补充,感激不尽。



目录
相关文章
|
25天前
|
机器学习/深度学习 Python
堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能
本文深入探讨了堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能。文章详细介绍了堆叠的实现步骤,包括数据准备、基础模型训练、新训练集构建及元学习器训练,并讨论了其优缺点。
43 3
|
2月前
|
Web App开发 前端开发 JavaScript
探索Python科学计算的边界:利用Selenium进行Web应用性能测试与优化
【10月更文挑战第6天】随着互联网技术的发展,Web应用程序已经成为人们日常生活和工作中不可或缺的一部分。这些应用不仅需要提供丰富的功能,还必须具备良好的性能表现以保证用户体验。性能测试是确保Web应用能够快速响应用户请求并处理大量并发访问的关键步骤之一。本文将探讨如何使用Python结合Selenium来进行Web应用的性能测试,并通过实际代码示例展示如何识别瓶颈及优化应用。
141 5
|
2月前
|
测试技术 API Python
【10月更文挑战第1天】python知识点100篇系列(13)-几种方法让你的电脑一直在工作
【10月更文挑战第1天】 本文介绍了如何通过Python自动操作鼠标或键盘使电脑保持活跃状态,避免自动息屏。提供了三种方法:1) 使用PyAutoGUI,通过安装pip工具并执行`pip install pyautogui`安装,利用`moveRel()`方法定时移动鼠标;2) 使用Pymouse,通过`pip install pyuserinput`安装,采用`move()`方法移动鼠标绝对位置;3) 使用PyKeyboard,同样需安装pyuserinput,模拟键盘操作。文中推荐使用PyAutoGUI,因其功能丰富且文档详尽。
|
12天前
|
安全
Python-打印99乘法表的两种方法
本文详细介绍了两种实现99乘法表的方法:使用`while`循环和`for`循环。每种方法都包括了步骤解析、代码演示及优缺点分析。文章旨在帮助编程初学者理解和掌握循环结构的应用,内容通俗易懂,适合编程新手阅读。博主表示欢迎读者反馈,共同进步。
|
20天前
|
JSON 安全 API
Python调用API接口的方法
Python调用API接口的方法
86 5
|
29天前
|
算法 决策智能 Python
Python中解决TSP的方法
旅行商问题(TSP)是寻找最短路径,使旅行商能访问每个城市一次并返回起点的经典优化问题。本文介绍使用Python的`ortools`库解决TSP的方法,通过定义城市间的距离矩阵,调用库函数计算最优路径,并打印结果。此方法适用于小规模问题,对于大规模或特定需求,需深入了解算法原理及定制策略。
37 15
WK
|
1月前
|
Python
Python中format_map()方法
在Python中,`format_map()`方法用于使用字典格式化字符串。它接受一个字典作为参数,用字典中的键值对替换字符串中的占位符。此方法适用于从字典动态获取值的场景,尤其在处理大量替换值时更为清晰和方便。
WK
79 36
|
27天前
|
机器学习/深度学习 人工智能 算法
强化学习在游戏AI中的应用,从基本原理、优势、应用场景到具体实现方法,以及Python在其中的作用
本文探讨了强化学习在游戏AI中的应用,从基本原理、优势、应用场景到具体实现方法,以及Python在其中的作用,通过案例分析展示了其潜力,并讨论了面临的挑战及未来发展趋势。强化学习正为游戏AI带来新的可能性。
72 4
|
1月前
|
Python
Python编程中的魔法方法(Magic Methods)
【10月更文挑战第40天】在Python的世界中,魔法方法就像是隐藏在代码背后的神秘力量。它们通常以双下划线开头和结尾,比如 `__init__` 或 `__str__`。这些方法定义了对象的行为,当特定操作发生时自动调用。本文将揭开这些魔法方法的面纱,通过实际例子展示如何利用它们来增强你的类功能。
16 1
|
2月前
|
机器学习/深度学习 数据采集 数据挖掘
11种经典时间序列预测方法:理论、Python实现与应用
本文将总结11种经典的时间序列预测方法,并提供它们在Python中的实现示例。
102 2
11种经典时间序列预测方法:理论、Python实现与应用

热门文章

最新文章

下一篇
DataWorks