虚拟键盘AI

简介: 本文提供了一个虚拟键盘AI项目的详细代码实现,包括链接摄像头、手势识别、绘制键盘、确定选中字母以及使用`pynput`库模拟真实键盘输入的步骤,并附有环境配置指南。

虚拟键盘AI

网上有许多人写了原理,我就做重复工作了,唯一的愿望就是让后来者能无痛跑通代码
下面代码我下次更新会加上备注与层次说明,今天有点晚了
全部代码如下:

'''
1.链接摄像头
2.识别手势
3.绘制键盘
 3.1创建键盘字母List
 3.2通过循环绘制键盘
4.根据坐标,取得返回字母
 4.1 利用lmList[8]食指之间坐标,判断选中的字母
 4.2 利用食指与中指之间的距离,确认输入的字母
 5.扩展,修改键盘背景
 6.利用pynput模拟真实键盘输入
'''
import cv2
from cvzone.HandTrackingModule import HandDetector
from time import sleep
import numpy as np
import cvzone
from pynput.keyboard import Key,Controller
cap = cv2.VideoCapture(0)
cap.set(3,1280)
cap.set(4,720)
#识别手势
detector = HandDetector(detectionCon=1)
keyboard = Controller()
#键盘关键字
keys = [['Q','W','E','R','T','Y','U','I','O','P'],
        ['A','S','D','F','G','H','J','K','L',';'],
        ['Z','X','C','V','B','N','M',',','.','/']]
class Button():
    def __init__(self,pos,text,size = [50,50]):
        self.pos = pos
        self.text = text
        self.size = size
    # def draw(self,img):
    #     x,y = self.pos
    #     w,h = self.size
    #     cv2.rectangle(img, self.pos, (x+w,y+h), (255, 0, 255), cv2.FILLED)
    #     cv2.putText(img, self.text, (x+10,y+40),
    #                 cv2.FONT_HERSHEY_PLAIN, 3,(255, 255, 255), 2)
    #     return img
buttonList = []
finalText = ''
for j in range(len(keys)):
    for x,key in enumerate(keys[j]):
        #循环创建buttonList对象列表
        buttonList.append(Button([60*x+20,100+j*60],key))
#mybutton = Button([100,100],"Q")
def drawAll(img,buttonList):
    img1=img.copy()

    for button in buttonList:
        x, y = button.pos
        w, h = button.size
        cvzone.cornerRect(img1,(x,y,w,h),20,rt = 0)
        cv2.rectangle(img1, button.pos, (x + w, y + h), (255, 0, 255), cv2.FILLED)
        cv2.putText(img1, button.text, (x + 10, y + 40),
                    cv2.FONT_HERSHEY_PLAIN, 3, (255, 255, 255), 2)
    img=cv2.addWeighted(img,0.5,img1,0.5,0)
    return img

flag=True
prePress='0'#prePress和count都是为了控制按键的
count = 0

prex=0
prey=0
pretext='A'
while True:
    success,img = cap.read()
    #识别手势
    img = cv2.flip(img, 1)
    img = detector.findHands(img)
    lmList,bboxInfo = detector.findPosition(img)

    img = drawAll(img,buttonList )

    if lmList:
        for button in buttonList:
            x,y = button.pos
            w,h = button.size
            if x<lmList[8][0]<x+w and y<lmList[8][1]<y+h:
                cv2.rectangle(img, (x-5,y-5), (x + w + 5, y + h + 5), (175, 0, 175), cv2.FILLED)# 修改外矩形
                cv2.putText(img, button.text, (x + 10, y + 40),
                            cv2.FONT_HERSHEY_PLAIN, 3, (255, 255, 255), 2)
                l,_,_ = detector.findDistance(8,12,img,draw=False)
                #print('中指(12)和食指(8)之间的距离:',l)
                fingerUpList=detector.fingersUp()
                print(str(lmList[8][0]) + " " + str(lmList[8][1]))
                num=fingerUpList[0]+fingerUpList[1]+fingerUpList[2]+fingerUpList[3]+fingerUpList[4]
                if len(lmList)>8 and num<=2:

                    count+=1
                    num1=int(lmList[8][0])
                    num2=int(lmList[8][1])
                    if (num1-prex)*(num1-prex)+(num2-prey)*(num2-prey)>300:#如果上一按過這個鍵,那這一轮就不能摁
                        keyboard.press(button.text)
                        cv2.rectangle(img, button.pos, (x + w, y + h), (0, 255, 0), cv2.FILLED)
                        cv2.putText(img, button.text, (x + 10, y + 40),cv2.FONT_HERSHEY_PLAIN, 3, (255, 255, 255), 2)
                        finalText += button.text
                        print('当前选中的是:', button.text)

        prex = int(lmList[8][0])
        prey = int(lmList[8][1])

    cv2.rectangle(img, (20,350), (600, 400), (175, 0, 175), cv2.FILLED)
    cv2.putText(img, finalText, (20, 390),cv2.FONT_HERSHEY_PLAIN, 3, (255, 255, 255), 4)
    cv2.namedWindow("Image",cv2.WINDOW_FREERATIO)
    cv2.imshow("Image",img)
    if cv2.waitKey(1)==ord('q'):
        break

配置环境

pip install cvzone==1.4.1 -i https://pypi.tuna.tsinghua.edu.cn/simple/
在这里插入图片描述
得下载1.41版本,最新版本会报错
pip install Controller -i https://pypi.tuna.tsinghua.edu.cn/simple/
在这里插入图片描述
pip install pynput -i https://pypi.tuna.tsinghua.edu.cn/simple/
在这里插入图片描述
pip install mediapipe -i https://pypi.tuna.tsinghua.edu.cn/simple/
在这里插入图片描述
运行效果:
请添加图片描述

相关文章
|
存储 Cloud Native Linux
C++ QT 实时进行网络监测
C++ QT 实时进行网络监测
|
8月前
|
存储 人工智能 安全
有奖体验 AI 模特换装,解锁电商视觉新体验
在电商中,制作精美的商品展示图成本高且流程复杂。AI 换装技术允许商家快速更换模特的服装或配件,无需重新拍摄,大大缩短准备时间。这项技术减少了对专业摄影师和后期团队的依赖,使中小商家也能轻松产出高质量的商品图片,灵活响应市场变化,有效降低成本,提升竞争力。本方案利用函数计算 FC 构建 Web 服务,采用百炼视觉模型 qwen-vl-max-latest、aitryon、aitryon-refiner、shoemodel-v1 来分别实现 AI 人物主体信息提取、模特试衣、试衣精修、模特换鞋。
|
11月前
|
机器学习/深度学习 数据采集 供应链
使用Python实现智能食品库存管理的深度学习模型
使用Python实现智能食品库存管理的深度学习模型
505 63
|
12月前
|
消息中间件 存储 Serverless
【实践】快速学会使用阿里云消息队列RabbitMQ版
云消息队列 RabbitMQ 版是一款基于高可用分布式存储架构实现的 AMQP 0-9-1协议的消息产品。云消息队列 RabbitMQ 版兼容开源 RabbitMQ 客户端,解决开源各种稳定性痛点(例如消息堆积、脑裂等问题),同时具备高并发、分布式、灵活扩缩容等云消息服务优势。
286 2
|
数据挖掘 数据处理 索引
使用Python实现DataFrame中奇数列与偶数列的位置调换
使用Python实现DataFrame中奇数列与偶数列的位置调换
226 1
|
12月前
|
数据安全/隐私保护 Python
python学习十一:python常用模块使用,如 加密模块pyarmor,时间模块time等
这篇文章介绍了Python中两个常用模块的使用:加密模块pyarmor用于保护代码,以及时间模块time用于处理时间相关的功能。
484 0
|
数据采集 存储 数据可视化
芒果tv数据采集与可视化实现
本文介绍了使用Python网络爬虫技术从芒果TV抓取电影信息(包括名称、播放量、评分等),并通过Matloplit库和Wordcloud库进行数据处理与可视化分析的研究项目。
413 0
芒果tv数据采集与可视化实现
|
监控 关系型数据库 分布式数据库
PolarDB 读写分离的最佳实践
【8月更文第27天】PolarDB 是阿里云推出的一款高度兼容 MySQL、PostgreSQL 和 Oracle 的云原生数据库服务。它支持读写分离,能够显著提高应用的性能和响应速度。本文将详细介绍如何在 PolarDB 中实施读写分离策略,并通过示例代码演示具体的配置步骤。
449 1
|
监控 安全 计算机视觉
实战 | 18行代码轻松实现人脸实时检测【附完整代码与源码详解】Opencv、人脸检测
实战 | 18行代码轻松实现人脸实时检测【附完整代码与源码详解】Opencv、人脸检测
|
搜索推荐
8个邮件营销平台分析及对比
本文对比了8个热门邮件营销平台:Aoksend适合初创企业,Constant Contact用户友好,Sendinblue提供多元营销服务,GetResponse功能全面,蜂邮EDM适合大规模活动,MailerLite价格实惠,Campaign Monitor专业定制,ActiveCampaign侧重营销自动化。选择时应考虑自身需求和预算。