用香蕉也能玩电脑游戏—Tensorflow对象检测接口的简单应用

简介:

Tensorflow最近发布了用于对象检测的对象检测接口(Object Detection API),能够定位和识别图像中的对象。它能够快速检测图像允许从视频帧甚至网络摄像头进行连续检测。它也可以用于构建鼠标“Tensormouse”,一个使用网络摄像移动光标的应用程序。

你是否曾经想过使用其他物品比如香蕉来移动你的光标?我们现在就可以实现!

TensorMouse是一个小型的开源Python应用程序,它允许你通过在网络摄像头前移动任意物品(如杯子,苹果或香蕉)来移动光标,他可以做电脑鼠标或触控板的替代品。

f3d4a505cbf40f7283fa4f7a0bf83a32cd1e88c1


允许你用香蕉玩游戏

它是如何工作的?
TensorMouse记录来自网络摄像头的图像序列。然后将这些数据输入到Tensorflow对象检测接口中,返回对象的概率和位置的图。然后移动鼠标光标,使光标位置与图像上对象的位置对应。
例如,如果在图像的左上角检测到对象,光标将移动到屏幕的左上角。

应用程序的主要部分按顺序重复以下步骤:

  • 使用OpenCV从网络摄像头进行单帧采集
  • 使用Tensorflow对象检测接口进行对象检测
  • 根据检测到的对象位置移动鼠标光标

1.帧采集
使用Python OpenCV模块捕获来自网络摄像头的帧。它提供了一个跨平台的工具,用于快速的图像采集和缩放。然后将图像缩放到360p以提高性能。

2.对象检测
对象检测用于确定网络摄像头框中所需对象的相对位置。它使用在COCO数据集上训练的Tensorflow对象检测接口固有的Mobilenet神经网络图。该数据集由80个不同的对象组成,主要包括杯子,苹果,餐具等家用物品。

6a4d54ff1fca1147848820bc02545b8226a27832


检测到的具有带有相应概率的对象

如果检测到的对象相应的概率超过指定的阈值(一般为85%),则TensorMouse会将该对象视为检测对象,并计算检测到对象的方框的中心。

3.移动鼠标光标
Python包的pynput为执行鼠标指针的移动提供了跨平台支持。基于检测到的对象的相对位置将光标移动到该位置。意思是如果在图像的左上角检测到物体,光标将移动到屏幕的左上角。

应用程序然后返回到步骤1以从网络摄像头检索下一个图像并重复此过程。

如何使用它
应用程序的源代码发布在我的Gitlab repo中(https://github.com/tadejmagajna/TensorMouse)。

TensorMouse可以在任何主流的(Windows,Linux或MacOS)平台和几乎任何机器上运行,但是要实现良好的帧速率,它需要一个好点的CPU或支持CUDA的显卡。

安装
安装时要确保包依赖关系都已安装好。

  1. 安装Anaconda(我推荐安装它的变种Miniconda)
  2. 从Gitlab复制TensorMouse
  3. 打开终端并导航到项目根目录
  4. conda env create -f environment.yml(Linux / MacOS)或conda env create -f environment-win.yml(Windows)
  5. source activate tensormouse(Linux / MacOS)或activate tensormouse(Windows)
  6. 运行TensorMouse

一旦安装了依赖项并激活环境,我们可以简单地运行TensorMouse:

python tensormouse.py

然后等待约10-20秒,会有绿色消息显示Tensormouse成功启动。

这将运行Tensormouse跟踪其默认对象—杯子。但是你可以通过提供可选参数(obect=”OBJECTNAME”)使其与80个COCO数据集对象中的任意一个配合使用。

你还可以使用CTRL和ALT执行点击和拖动。

使用说明

  • 确保光线充足(Tensormouse在光线不好的情况下表现欠佳)
  • 需要对象保持与摄像头的距离,既不能太近导致占用整个摄像头帧,也不能太远导致检测不到
  • 如果你的对象检测性能较差,请尝试运行应用程序设置让它来检测杯子,它检测杯子时还是挺准的

本文为编译作品,转载请注明出处。更多内容关注微信公众号:atyun_com

目录
相关文章
|
2月前
|
机器学习/深度学习 API 语音技术
|
2月前
|
人工智能 PyTorch TensorFlow
人工智能应用工程师技能提升系列1、——TensorFlow2
人工智能应用工程师技能提升系列1、——TensorFlow2
77 0
|
2月前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能在公司监视员工电脑的软件中的崭新应用(TensorFlow)
在当今数字化时代,企业日益依赖人工智能技术来提高工作效率和确保数据安全。最近,TensorFlow作为一种强大的机器学习工具,开始在公司监视员工电脑的软件中崭露头角。本文将探讨TensorFlow在这一领域中的创新应用,并通过多个代码示例展示其功能。
241 0
|
2月前
|
机器学习/深度学习 PyTorch TensorFlow
TensorFlow与PyTorch在Python面试中的对比与应用
【4月更文挑战第16天】这篇博客探讨了Python面试中TensorFlow和PyTorch的常见问题,包括框架基础操作、自动求梯度与反向传播、数据加载与预处理。易错点包括混淆框架API、动态图与静态图的理解、GPU加速的利用、模型保存恢复以及版本兼容性。通过掌握这些问题和解决策略,面试者能展示其深度学习框架技能。
55 9
|
2月前
|
TensorFlow 算法框架/工具 异构计算
TensorFlow检测GPU是否可用
TensorFlow检测GPU是否可用
33 0
|
2月前
|
机器学习/深度学习 数据采集 TensorFlow
TensorFlow在图像识别中的应用
【4月更文挑战第17天】本文探讨了TensorFlow在图像识别中的应用,介绍了图像识别的基本步骤,包括数据准备、特征提取、模型训练和评估。重点讨论了卷积神经网络(CNN)和预训练模型(如VGG、ResNet、Inception)在模型架构中的作用。数据预处理方面,提到了归一化、大小调整和数据增强等技术。通过示例展示了如何使用TensorFlow构建、编译和训练CNN模型,并评估其性能。文章强调,结合最佳实践,TensorFlow能有效支持高效的图像识别模型开发。
|
2月前
|
机器学习/深度学习 人工智能 API
人工智能应用工程师技能提升系列2、——TensorFlow2——keras高级API训练神经网络模型
人工智能应用工程师技能提升系列2、——TensorFlow2——keras高级API训练神经网络模型
57 0
|
8月前
|
机器学习/深度学习 监控 TensorFlow
利用TensorFlow实现机器学习代码以用防止员工泄密软件检测员工泄密行为
随着信息安全的重要性日益增加,保护敏感数据免受员工泄密的风险成为组织的首要任务之一。在本文中,我们将讨论如何使用TensorFlow,一种强大的开源机器学习框架,来实现防止员工泄密软件。我们将演示如何编写代码来监控员工的行为,检测潜在的泄密行为,并在必要时采取自动化措施。这一切将有助于加强数据安全,防止敏感信息泄露。
189 2
|
8月前
|
TensorFlow 算法框架/工具 异构计算
YOLO实践应用之搭建开发环境(Windows系统、Python 3.8、TensorFlow2.3版本)
基于YOLO进行物体检测、对象识别,先和大家分享如何搭建开发环境,会分为CPU版本、GPU版本的两种开发环境,本文会分别详细地介绍搭建环境的过程。主要使用TensorFlow2.3、opencv-python4.4.0、Pillow、matplotlib 等依赖库。
161 0
|
机器学习/深度学习 编译器 TensorFlow
瞎聊深度学习——TensorFlow的基本应用
瞎聊深度学习——TensorFlow的基本应用