掌握计算机自动化:PyAutoGUI库详细教程(最全使用方法,每行代码都有注释,帮你解决与之有关的所有问题)

简介: 掌握计算机自动化:PyAutoGUI库详细教程(最全使用方法,每行代码都有注释,帮你解决与之有关的所有问题)

这篇博客主要介绍了如何使用Python库pyAutoGUI进行计算机自动化行为操作。文章首先介绍了pyAutoGUI库的概括和安装方法。接下来,详细讲解了操作前需要了解的屏幕分辨率与尺寸,暂停操作,以及故障保护功能的使用方法。在鼠标操作部分,详细解析了鼠标的移动、获取位置、拖拽、点击以及单击分布操作。键盘操作部分,讨论了如何进行输入字符、按键以及热键操作。此外,文章还提到了使用消息框显示信息,可设置一个或多个按钮,及带有文本输入框和密码输入框的消息框使用方法。最后,文章详述了如何进行屏幕截图并在指定区域内截屏,以及图片定位的方法。整篇文章旨在帮助读者理解和掌握使用pyAutoGUI库进行计算机自动化操作的方法。

一、pyAutoGUI 概括

pyAutoGUI是一个用于自动化计算机行为的Python库。它可以用来操作鼠标和键盘,模拟人类的输入方式,比如移动鼠标、点击按钮、输入文本等。pyAutoGUI还可以用来开发自动化工具,比如自动回复聊天机器人、自动游戏挂机等。

二、pyAutoGUI 库安装

pyAutoGUI的下载代码如下:

打开命令行窗口输入以下代码即可

pip install pyautogui

或者,你可以直接从PyCharm上下载,教程如下:Python基础第八篇(Python异常处理,模块与包)

三、pyAutoGUI 操作前置知识

1.屏幕分辨率与尺寸

为方便编写代码,pyautogui 接口用起了别名“pg”

import pyautogui as pg
import time
# 获取屏幕尺寸
# 元组类型的返回值
screen_width, screen_height = pg.size()
# 获取屏幕宽高
print("屏幕宽度:", screen_width)
print("屏幕高度:", screen_height)

2.暂停操作

#暂停操作,全局暂停,局部暂停
#全局暂停是指在程序中暂停所有操作(进行一行改代码,停一次,一般写在接口下面先执行),局部暂停是指在程序中暂停某个操作
#--------全局暂停--------
#默认是0.1  浮点型  单位是秒
pg.PAUSE = 1.0
#--------局部暂停--------
#默认是0  浮点型  单位是秒
time.sleep(2)

3.故障保护功能

pyAutoGUI 有一个名为“故障保护”的功能,当鼠标或键盘操作失败时,这个功能可以防止程序崩溃。要启用故障保护功能,可以在使用pyAutoGUI之前导入pyautogui.PAUSE:

插入

import pyautogui as pg
pg.PAUSE = 1

这样,当pyAutoGUI遇到错误时,它会等待1秒后再尝试执行操作。你可以根据需要调整PAUSE的值。

或者在pyAutoGUI程序执行过程中想要停止,可以快速将鼠标移动到屏幕的四个角以中止程序,默认存在的。不想用可在pyAutoGUI代码执行之前插入

pg.failsafe=false

四、鼠标操作

1.鼠标移动操作

#移动鼠标到指定位置
#duration是指所用时间,默认是0.25  浮点型  单位是秒
pg.moveTo(100, 100, duration=1)
#移动鼠标到相对位置
pg.move(100, -100, duration=1)

2.获取鼠标位置的坐标值

# 获取鼠标位置的坐标值
mouse_x, mouse_y = pg.position()
print("鼠标位置的坐标值:", mouse_x, mouse_y)
#检测指定坐标是否在屏幕上
print("(100, 100)坐标是否在屏幕上:", pg.onScreen(100, 100))

3.鼠标拖拽操作

#鼠标拖拽操作
#默认左键,左键 left,右键 right,中键 middle
#绝对拖拽,指拖拽到那个位置
pg.dragTo(x=100, y=-100, duration=0.5, button='left')
#相对拖拽,相对于当前位置拖拽
pg.drag(xOffset=100, yOffset=100, duration=0.5, button='right')

4.鼠标点击操作

#鼠标点击操作
#单击
#button:默认左键,左键 left,右键 right,中键 middle
#clicks:点击次数,默认是1次
#interval:每次点击间隔时间,默认是0
#duration:持续时间,默认是0
pg.click(x=90, y=100,clicks=2,interval=0,duration=0, button='left')
# 双击
#button:默认左键,左键 left,右键 right,中键 middle
pg.doubleClick(x=90, y=100, duration=0, button='left')

5.鼠标单击分布操作

#单击分布操作
#按下鼠标键位
pg.mouseDown(button='left')
#释放鼠标键位
pg.mouseUp(button='left')

五、键盘操作

1.输入字符

# 键盘操作
#输入字符
#messge:想要输入的字符
#interval:每次输入间隔时间,默认是0
#不能直接输入中文,需要使用unicode编码
#输入时应先使输入框获取焦点,否则无法输入(可以先单击一下)
pg.write("Hello, World!",interval=0.2)

2.按键操作

#按键操作
#presses:按键的次数,默认是1次
#interval:每次按键间隔时间,默认是0
pg.press('enter',presses=2,interval=0.2)

3.热键操作(组合键)

#热键操作
#interval:每次按键间隔时间,默认是0
pg.hotkey('ctrl','a',interval=0.2)

常用按键

# 所有按键的字符串标识如下
print(pyautogui.KEYBOARD_KEYS)
# 输出:
[
'\t', '\n', '\r', ' ', '!', '"', '#', '$', '%', '&', "'", '(', ')', '*', '+', ',', '-', '.', '/', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', ':', ';', '<', '=', '>', '?', '@', '[', '\\', ']', '^', '_', '`', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 
'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '{', '|', '}', '~', 'accept', 'add', 'alt', 'altleft', 'altright', 'apps', 
'backspace', 'browserback', 'browserfavorites', 'browserforward', 'browserhome', 'browserrefresh', 'browsersearch', 'browserstop', 'capslock', 'clear', 'convert', 'ctrl', 'ctrlleft', 'ctrlright', 'decimal', 'del', 'delete', 'divide', 'down', 'end', 'enter', 'esc', 'escape', 'execute', 'f1', 'f10', 'f11', 'f12', 'f13', 'f14', 'f15', 'f16', 'f17', 'f18', 'f19', 'f2', 'f20', 'f21', 'f22', 'f23', 'f24', 'f3', 'f4', 'f5', 'f6', 'f7', 'f8', 'f9', 'final', 'fn', 'hanguel', 'hangul', 'hanja', 'help', 'home', 'insert', 'junja', 'kana', 'kanji', 'launchapp1', 'launchapp2', 'launchmail', 'launchmediaselect', 'left', 'modechange', 'multiply', 'nexttrack', 'nonconvert', 'num0', 'num1', 'num2', 'num3', 'num4', 'num5', 'num6', 'num7', 'num8', 'num9', 'numlock', 'pagedown', 'pageup', 'pause', 'pgdn', 'pgup', 'playpause', 'prevtrack', 'print', 'printscreen', 'prntscrn', 'prtsc', 'prtscr', 'return', 'right', 'scrolllock', 'select', 'separator', 'shift', 'shiftleft', 'shiftright', 'sleep', 'space', 'stop', 'subtract', 'tab', 'up', 'volumedown', 'volumemute', 'volumeup', 'win', 'winleft', 'winright', 'yen', 'command', 'option', 'optionleft', 'optionright'
]
+ 'Add' - 加号键("+")通常用于添加或增加操作。
+ 'Alt' - 通常与键盘上的 "Alt" 键相对应,它是一种常用的快捷键,可以用于访问特殊功能或菜单。
+ 'Altleft' - 这个单词通常与键盘上的 "Alt" 键左边的部分相对应,也是用于访问特殊功能或菜单。
+ 'Altright' - 这个单词通常与键盘上的 "Alt" 键右边的部分相对应,也是用于访问特殊功能或菜单。
+ 'Apps' - 右键菜单
+ 'Backspace' - 这个单词通常与键盘上的 "Backspace" 键相对应,用于删除前一个字符或命令。
+ 'Browserback' - 这个单词通常与浏览器相关的快捷键相对应,用于返回浏览器的上一个页面。
+ 'Browserfavorites' - 这个单词通常与浏览器相关的快捷键相对应,用于访问浏览器的收藏夹。
+ 'Browserforward' - 这个单词通常与浏览器相关的快捷键相对应,用于前进到浏览器的一个页面。
+ 'Browserhome' - 这个单词通常与浏览器相关的快捷键相对应,用于导航到浏览器的首页。
+ 'Browserrefresh' - 这个单词通常与浏览器相关的快捷键相对应,用于刷新当前页面。
+ 'Browsersearch' - 这个单词通常与浏览器相关的快捷键相对应,用于在浏览器中执行搜索操作。
+ 'Browserstop' - 这个单词通常与浏览器相关的快捷键相对应,用于停止加载当前页面。
+ 'Capslock' - 这个单词通常与键盘上的 "Capslock" 键相对应,用于锁定或解锁大写字母输入。
+ 'Ctrl' - 这个单词通常与键盘上的 "Ctrl" 键相对应,用于执行各种控制命令或组合键操作。
+ 'Ctrlleft' - 这个单词通常与键盘上的 "Ctrl" 键左边的部分相对应,也是用于执行各种控制命令或组合键操作。
+ 'Ctrlright' - 这个单词通常与键盘上的 "Ctrl" 键右边的部分相对应,也是用于执行各种控制命令或组合键操作。
+ 'Decimal' - 这个单词通常与键盘上的 "Decimal" 或 "." 键相对应,用于输入小数点或十进制数字。
+ 'fn' - "fn" 是一个特殊的键盘功能键,通常在笔记本电脑和一些特定的键盘布局中找到。它用于配合其他按键使用,以实现一些特定的功能,如调节亮度、音量等。
+ 'home' - "home" 对应的按键是键盘上的 "Home" 键,通常用于快速导航到页面的顶部或文本的开头。
+ 'insert' - "insert" 对应的按键是键盘上的 "Insert" 键,用于插入文本或数据。
+ 'left', 'right', 'up', 'down' - 这些方向键对应的按键分别是 "Left Arrow"、"Right Arrow"、"Up Arrow" 和 "Down Arrow"。它们通常用于控制光标的位置。
+ 'num0' 到 'num9' - 这些数字键对应的按键是从 "0" 到 "9"。它们用于输入数字和进行数学运算。
+ 'numlock', 'scrolllock', 'select', 'separator', 'tab' - 这些都是特殊的锁定键或其他功能键,通常用于控制光标移动、滚动页面、选择文本等操作。
+ 'space', 'return' - "Space" 键对应的按键是空格键,用于在文本中插入空格。"Return" 键对应的按键是回车键,用于换行或确认输入。
+ 'win', 'winleft', 'winright' - 这些是特定的功能键,通常用于操作系统中的窗口控制和菜单操作。"Win" 键对应的按键通常是 Windows 徽标键(通常是带有 Windows 标志的按键)。"Winleft" 和 "Winright" 是左右 Windows 功能键的称呼,但它们并不对应键盘上的标准按键

六,消息框

1.可以设置一个button

#消息框
#title:标题
#text:文本
# button:按钮,默认是OK
#返回值:默认是OK
arr1 = pg.alert(title='Hello, World!',text='没钱只能当牛马',button='ok')
print(arr1)

2.可以设置多个button

#可以设置多个button
#返回值:返回用户点击的按钮
arr2 = pg.confirm(title='Hello, World!',text='没钱只能当牛马',buttons=['ok','cancel'])
print(arr2)

3.自带文本输入框的消息框

#自带文本输入框的消息框
#返回值:返回用户输入的内容
#文本输入框没字返回:None
arr3=pg.prompt(title='Hello, World!',text='没钱只能当牛马',default='请您输入:')
print("您输入的内容是:"+arr3)

4.自带密码的文本输入框的消息框

#自带密码的文本输入框的消息框
#返回值:返回用户输入的密码
#密码没字返回:None
arr4=pg.password(title='Hello, World!',text='没钱只能当牛马',default='请您输入:',mask='*')
print("您输入的密码是:"+arr4)

七、屏幕截图

1.截全屏

#屏幕截图
#imageformat:截图保存的格式,默认是png
#region:截图的范围,默认是整个屏幕
# 截取全屏 在1920 x 1080屏幕上,screenshot()函数大约需要100毫秒-不快但不慢。
# 截取全屏,并以图片保存
pg.screenshot("E:\\pythonDemo\\python_2024\\all.png")

2.指定区域内截屏

#指定区域内截屏
#region:截图的范围,默认是整个屏幕 : [开始位置x,开始位置y,x扩展的分辨率,y扩展的分辨率]
pg.screenshot("E:\\pythonDemo\\python_2024\\all2.png",region=[100,100,500,500])

3.图片定位

#图片定位
#定位到的图片的坐标(从左到右,从上到下)
#image:图片路径
#confidence:定位精度,默认是0.8
#count:定位到的图片数量,默认是1
#返回图片中心点
pg.locateCenterOnScreen("E:\\pythonDemo\\python_2024\\Google_tubiao.png",confidence=0.1)


相关文章
|
7天前
|
测试技术 API Android开发
《手把手教你》系列基础篇(九十七)-java+ selenium自动化测试-框架设计篇-Selenium方法的二次封装和页面基类(详解教程)
【7月更文挑战第15天】这是关于自动化测试框架中Selenium API二次封装的教程总结。教程中介绍了如何设计一个支持不同浏览器测试的页面基类(BasePage),该基类包含了对Selenium方法的二次封装,如元素的输入、点击、清除等常用操作,以减少重复代码。此外,页面基类还提供了获取页面标题和URL的方法。
23 2
|
8天前
|
Web App开发 XML Java
《手把手教你》系列基础篇(九十六)-java+ selenium自动化测试-框架之设计篇-跨浏览器(详解教程)
【7月更文挑战第14天】这篇教程介绍了如何使用Java和Selenium构建一个支持跨浏览器测试的自动化测试框架。设计的核心是通过读取配置文件来切换不同浏览器执行测试用例。配置文件中定义了浏览器类型(如Firefox、Chrome)和测试服务器的URL。代码包括一个`BrowserEngine`类,它初始化配置数据,根据配置启动指定的浏览器,并提供关闭浏览器的方法。测试脚本`TestLaunchBrowser`使用`BrowserEngine`来启动浏览器并执行测试。整个框架允许在不同浏览器上运行相同的测试,以确保兼容性和一致性。
21 3
|
10天前
|
存储 Web App开发 Java
《手把手教你》系列基础篇(九十五)-java+ selenium自动化测试-框架之设计篇-java实现自定义日志输出(详解教程)
【7月更文挑战第13天】这篇文章介绍了如何在Java中创建一个简单的自定义日志系统,以替代Log4j或logback。
34 5
|
13天前
|
设计模式 测试技术 Python
《手把手教你》系列基础篇(九十二)-java+ selenium自动化测试-框架设计基础-POM设计模式简介(详解教程)
【7月更文挑战第10天】Page Object Model (POM)是Selenium自动化测试中的设计模式,用于提高代码的可读性和维护性。POM将每个页面表示为一个类,封装元素定位和交互操作,使得测试脚本与页面元素分离。当页面元素改变时,只需更新对应页面类,减少了脚本的重复工作和维护复杂度,有利于团队协作。POM通过创建页面对象,管理页面元素集合,将业务逻辑与元素定位解耦合,增强了代码的复用性。示例展示了不使用POM时,脚本直接混杂了元素定位和业务逻辑,而POM则能解决这一问题。
29 6
|
11天前
|
设计模式 Java 测试技术
《手把手教你》系列基础篇(九十四)-java+ selenium自动化测试-框架设计基础-POM设计模式实现-下篇(详解教程)
【7月更文挑战第12天】在本文中,作者宏哥介绍了如何在不使用PageFactory的情况下,用Java和Selenium实现Page Object Model (POM)。文章通过一个百度首页登录的实战例子来说明。首先,创建了一个名为`BaiduHomePage1`的页面对象类,其中包含了页面元素的定位和相关操作方法。接着,创建了测试类`TestWithPOM1`,在测试类中初始化WebDriver,设置驱动路径,最大化窗口,并调用页面对象类的方法进行登录操作。这样,测试脚本保持简洁,遵循了POM模式的高可读性和可维护性原则。
15 2
|
15天前
|
XML Java 测试技术
《手把手教你》系列基础篇(九十一)-java+ selenium自动化测试-框架设计基础-Logback实现日志输出-下篇(详解教程)
【7月更文挑战第9天】在Java项目中,使用Logback配置可以实现日志按照不同包名输出到不同的文件,并且根据日志级别分开记录。
29 4
|
16天前
|
XML Java 测试技术
《手把手教你》系列基础篇(九十)-java+ selenium自动化测试-框架设计基础-Logback实现日志输出-中篇(详解教程)
【7月更文挑战第8天】这篇教程介绍了如何使用Logback将Java应用的日志输出到文件中。首先,通过创建`logback.xml`配置文件,设置`FileAppender`来指定日志文件路径和格式。然后,提供了一个`RollingFileAppender`的例子,用于每日生成新的日志文件并保留一定天数的历史记录。文中包含配置文件的XML代码示例,并展示了控制台输出和生成的日志文件内容。教程最后提到了一些可能遇到的问题及解决建议。
18 0
《手把手教你》系列基础篇(九十)-java+ selenium自动化测试-框架设计基础-Logback实现日志输出-中篇(详解教程)
|
17天前
|
Java 关系型数据库 测试技术
《手把手教你》系列基础篇(八十九)-java+ selenium自动化测试-框架设计基础-Logback实现日志输出-上篇(详解教程)
【7月更文挑战第7天】Apache Log4j2的安全漏洞促使考虑使用logback作为替代的日志框架。Logback由log4j创始人设计,提供更好的性能,更低的内存使用,并且能够自动重载配置文件。它分为logback-core、logback-classic(实现了SLF4J API)和logback-access(用于Servlet容器集成)三个模块。配置涉及Logger、Appender(定义日志输出目的地)和Layout(格式化日志)。
26 1
|
12天前
|
设计模式 Java 测试技术
《手把手教你》系列基础篇(九十三)-java+ selenium自动化测试-框架设计基础-POM设计模式实现-上篇(详解教程)
【7月更文挑战第11天】页面对象模型(POM)通过Page Factory在Java Selenium测试中被应用,简化了代码维护。在POM中,每个网页对应一个Page Class,其中包含页面元素和相关操作。对比之下,非POM实现直接在测试脚本中处理元素定位和交互,代码可读性和可维护性较低。
14 0
|
18天前
|
XML Java 测试技术
《手把手教你》系列基础篇(八十八)-java+ selenium自动化测试-框架设计基础-Log4j 2实现日志输出-下篇(详解教程)
【7月更文挑战第6天】本文介绍了如何使用Log4j2将日志输出到文件中,重点在于配置文件的结构和作用。配置文件包含两个主要部分:`appenders`和`loggers`。`appenders`定义了日志输出的目标,如控制台(Console)或其他文件,如RollingFile,设置输出格式和策略。`loggers`定义了日志记录器,通过`name`属性关联到特定的类或包,并通过`appender-ref`引用`appenders`来指定输出位置。`additivity`属性控制是否继承父logger的配置。
22 0