自动识别图片点击脚本,文字识别自动点击器, 能识别屏幕内容并自动点击

简介: 本方案采用OCR文字识别+图像匹配双模式识别技术:OCR引擎识别屏幕文字内容OpenCV模板匹配识别图形元素PyAutoGUI实现

下载地址:http://m.pan38.com/download.php?code=RQEBET 提取码:6666

基于OCR的屏幕自动点击器开发指南
一、技术原理
本方案采用OCR文字识别+图像匹配双模式识别技术:
OCR引擎识别屏幕文字内容
OpenCV模板匹配识别图形元素
PyAutoGUI实现精准鼠标控
多线程处理保证实时性
二、核心代码实现

import cv2
import numpy as np
import pyautogui
import pytesseract
import time
import threading
from PIL import ImageGrab

class AutoClicker:
def init(self):
self.running = False
self.ocr_config = r'--oem 3 --psm 6'
self.template_threshold = 0.8
self.refresh_rate = 0.5

def start_clicker(self):
    self.running = True
    self.thread = threading.Thread(target=self._monitor)
    self.thread.start()

def stop_clicker(self):
    self.running = False
    self.thread.join()

def _monitor(self):
    while self.running:
        screenshot = ImageGrab.grab()
        screen_np = np.array(screenshot)

        # OCR模式处理
        text_data = pytesseract.image_to_string(screen_np, config=self.ocr_config)
        if "目标按钮" in text_data:
            self._click_text_target("目标按钮", screen_np)

        # 图像模板匹配模式
        templates = ["confirm.png", "accept.png", "next.png"]
        for template in templates:
            self._match_template(template, screen_np)

        time.sleep(self.refresh_rate)

def _click_text_target(self, target_text, screen_np):
    data = pytesseract.image_to_data(screen_np, config=self.ocr_config, output_type=pytesseract.Output.DICT)

    for i, text in enumerate(data['text']):
        if target_text in text:
            x = data['left'][i]
            y = data['top'][i]
            w = data['width'][i]
            h = data['height'][i]

            center_x = x + w//2
            center_y = y + h//2

            pyautogui.click(center_x, center_y)
            print(f"Clicked text target at ({center_x}, {center_y})")
            return True
    return False

def _match_template(self, template_path, screen_np):
    try:
        template = cv2.imread(template_path, 0)
        if template is None:
            return False

        screen_gray = cv2.cvtColor(screen_np, cv2.COLOR_BGR2GRAY)
        res = cv2.matchTemplate(screen_gray, template, cv2.TM_CCOEFF_NORMED)

        loc = np.where(res >= self.template_threshold)
        for pt in zip(*loc[::-1]):
            center_x = pt[0] + template.shape[1]//2
            center_y = pt[1] + template.shape[0]//2

            pyautogui.click(center_x, center_y)
            print(f"Clicked template {template_path} at ({center_x}, {center_y})")
            return True
    except Exception as e:
        print(f"Template matching error: {e}")
    return False

使用示例

if name == "main":
clicker = AutoClicker()
try:
clicker.start_clicker()
while True:
time.sleep(1)
except KeyboardInterrupt:
clicker.stop_clicker()

三、功能扩展

配置文件支持:读取JSON配置定义点击规则

多显示器适配:通过screeninfo库获取多屏信息

性能优化:使用CUDA加速OpenCV处理

日志系统:记录操作历史便于调试

图形界面:PyQt5构建管理界面

四、注意事项

管理员权限运行(Windows系统)

屏幕缩放设置为100%

不同语言需调整Tesseract训练数据

需要安装VC++运行库

相关文章
|
并行计算 PyTorch 算法框架/工具
社区供稿 | 本地部署通义千问大模型做RAG验证
这篇文章中,我们通过将模搭社区开源的大模型部署到本地,并实现简单的对话和RAG。
|
10月前
识图点击脚本,图片识别连点器,自动点击精灵【autojs】
主脚本实现基于模板匹配的自动点击功能,包含UI界面和参数配置。增强版提供了多目标识别和
|
Windows
万能脚本录制器(支持鼠标/键盘的前台和后台,支持多种绑定模式)
一款模拟鼠标键盘动作的软件。通过制作脚本,可以代替双手,自动执行一系列鼠标键盘动作。本程序简单易用,不需要任何编程知识就可以作出功能强大的脚本。只要在电脑前用双手可以完成的动作,本程序都可以替代完成。
17501 0
万能脚本录制器(支持鼠标/键盘的前台和后台,支持多种绑定模式)
|
2月前
|
SQL Java 数据库
【MyBatis-Plus】Spring Boot + MyBatis-Plus 进行各种数据库操作(附完整 CRUD 项目代码示例)
本文详解Spring Boot集成MyBatis-Plus全流程:从依赖引入、数据源配置、Mapper扫描到分页/乐观锁/逻辑删除等核心插件配置;涵盖BaseMapper基础CRUD、LambdaQueryWrapper条件查询、Service层封装、自定义XML多表关联及批量优化实践,附完整可运行示例。
|
2月前
|
人工智能 自然语言处理 API
AI漫剧零代码制作喂饭级教程:OpenClaw阿里云/本地部署+Seed2.0 Skills 实战指南
无需专业剪辑技术、不用复杂软件操作,甚至不用手动绘制分镜——借助OpenClaw与Seed2.0 Skills的组合,2026年普通人也能零门槛制作AI漫剧。从剧本创作、分镜设计到视频合成,全程AI自动化完成,手机端也能快速产出高质量作品。开源项目「AI漫导」(director_ai)已收获1.1k Star,其核心逻辑正是通过OpenClaw集成Seed2.0漫剧专属技能,让漫剧制作从“专业门槛”变为“人人可玩”。
2865 2
|
10月前
|
Web App开发 数据安全/隐私保护 Python
万能ck提取登录软件,京东贴吧淘宝拼多多cookie提取工具,python框架分享
这个框架使用了Selenium进行浏览器自动化操作,包含了京东和淘宝的登录示例。代码展示了如
|
10月前
|
文字识别 Python
文字识别自动点击器, 脚本识别文字然后点击软件,按键精灵识别文字点击
该实现包含完整的OCR识别和自动化点击功能,支持多种配置选项和文本匹配模式。使用时需
|
9月前
|
机器学习/深度学习 Android开发 数据安全/隐私保护
手机脚本录制器, 脚本录制器安卓,识图识色屏幕点击器【autojs】
完整的UI界面,包含录制控制按钮和状态显示 屏幕点击动作录制功能,记录点击坐标和时间间隔
|
10月前
|
运维 安全 网络协议
打印机共享,错误代码0x00000709,0x0000011b等修复
本文介绍了多款打印机共享修复工具,适用于解决Windows系统连接共享打印机时出现的各种问题,例如错误代码0x0000011b、0x00000709等。内容涵盖问题原因分析、推荐工具介绍及详细修复步骤,帮助用户快速恢复打印机连接。
4544 0
|
10月前
京东外卖抢单脚本,京东骑手抢单辅助插件,autojs框架分享
这段代码展示了如何使用AutoJS实现一个基础的订单监听和抢单逻辑。实际应用中需要考虑更多细节