基于OCR的水位检测项目 水位识别

简介: 基于OCR的水位检测项目 水位识别

水位尺读数系统概述

本项目旨在利用OCR技术结合水位尺,实现自动读取水位数值的功能,目标精度达到0.01。整个系统的设计和实现涵盖了从原始数据的采集、预处理、目标检测、字符识别到最终的水位计算等多个环节,旨在构建一个高效、准确的自动化水位监测解决方案。

├── Hough(霍夫变换检测直线)
├── LSTM-OCR(基于LSTM模型的OCR方法,包含部分权重)
├── Number_detect_dataset(用于训练数字检测模型YOLO v3的数据集)
├── Post_Process_Result(OCR模型输出)
├── data_for_ocr_train(用于训练OCR模型的数据集)
├── demo(演示系统源码与可执行文件下载地址)
├── TPS(模糊文本识别模型)
├── creat_dataset(用于生成合成数据集,训练TPS模型)

环境配置

  • 操作系统:支持Windows或Linux。
  • 编程语言:Python 3.5及以上版本。
  • 深度学习框架:TensorFlow-GPU 1.14.0及以上版本,要求CUDA 10.0及以上版本支持GPU加速。
  • 调整摄像头至仅拍摄水位尺区域,使用训练好的目标检测模型检测数字区域(如图1左),根据bounding
    box的位置关系(主要基于Y轴,根据实际情况需要分别讨论(1)),确定检测区域1和检测区域2,其中,检测区域1代表最下方的刻度区数字,精度为0.1,经过OCR模型识别数字,得到值L2(数值);检测区域2为最下方的较长数字,精度为1,经过OCR模型识别数字,得到值L1(数值),检测区域1和检测区域2由bounding
    box的宽度区分(如图1中);
  • 另外,检测区域1的bounding
    box下边界至水面为检测区域三,通过霍夫变换检测直线数目,精度为0.01,得到值L3(直线条数);最终,通过计算式L1-(10-L2·0.1)-0.25·L3(1),获得最终水位(如图1右)。
  • 其中(1)中的讨论主要指较长数字区域(L1值)和刻度区数字区域(L2值)的位置关系,实际数据中,二者并不总是呈现L1在L2上方的情况。所以需要分情况确定加减号,详见附录。
    方案实施

项目目录结构

  • Hough(霍夫变换检测直线):负责通过霍夫变换检测水位尺上的直线,用于提高0.01精度的水位测量。
  • LSTM-OCR(基于LSTM模型的OCR方法):实现对检测到的数字区域的字符识别,包括模型训练和预测。
  • Number_detect_dataset(用于训练数字检测模型YOLO v3的数据集):提供训练YOLO v3模型所需的数据集。
  • Post_Process_Result(OCR模型输出):存放OCR模型识别后的输出结果。
  • data_for_ocr_train(用于训练OCR模型的数据集):为训练OCR模型准备的数据集。
  • demo(演示系统源码与可执行文件下载地址):包含演示系统的源代码及可执行文件。
  • TPS(模糊文本识别模型):针对模糊文本的识别模型。
  • creat_dataset(用于生成合成数据集,训练TPS模型):生成合成数据集,用于训练TPS模型。

技术方案

整体思路
  1. 摄像头调整:确保摄像头只拍摄水位尺的有效区域,减少环境干扰。
  2. 目标检测:使用YOLO v3模型检测水位尺上的数字区域,通过bounding box的位置关系确定检测区域1(最下方的刻度区数字,精度为0.1)和检测区域2(最下方的较长数字,精度为1)。
  3. OCR识别:利用LSTM模型对检测区域内的数字进行识别,输出数字值。
  4. 霍夫变换:通过霍夫变换检测直线数目,精度为0.01,以进一步细化水位的测量。
  5. 水位计算:综合上述步骤的信息,根据特定公式计算最终水位值。
方案实施
  1. 原始数据处理:从摄像头采集的数据中筛选并提取出感兴趣的水位尺区域。
  2. 数据标注:对提取出的区域进行标注,数字检测采用YOLO v3模型,标注格式为YOLO格式。
  3. 数字检测模型训练:基于标注数据训练YOLO v3模型,用于检测水位尺上的数字。
  4. OCR模型训练:使用数字检测模型的结果作为输入,训练LSTM模型,以识别检测到的数字区域。
  5. 霍夫变换应用:对检测区域1和检测区域2之间的区域应用霍夫变换,检测直线数目,以提高水位测量的精度。

存在的问题与挑战

  • 检测精度:目标检测模型可能存在漏检或误检的情况,尤其是在尺子倾斜或弯曲的情况下。
  • 识别准确性:OCR模型在识别长数字时可能出现位数错误,这主要是因为训练数据中多位数字的数量较少。
  • 霍夫变换的鲁棒性:霍夫变换对参数非常敏感,容易受到环境因素的影响,如水面反射等,导致直线检测不准确。

演示系统

  • 用户界面:基于PyQt构建,提供了友好的用户界面,方便用户选择图片进行水位读数。
  • 授权限制:演示系统设有授权限时,需要将系统时间。

该项目是一个复杂的多阶段处理流程,每个阶段的成功实施都是保证最终水位读数准确性的关键。未来的工作将集中在提升各模块的性能和鲁棒性,以及优化整个系统的运行效率。

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
18天前
|
SQL 安全 测试技术
《ZAKU渗透论:卓伊凡的2026渗透工程》第一章:黑客是怎么工作的?
渗透测试是授权下模拟黑客攻击,检验系统安全性;白帽合法防护,黑帽非法入侵,灰帽亦违法。攻击分7步:侦察、武器化、投递、利用、安装、C2、目标达成。它不同于自动化漏洞扫描,重在人工验证与深度分析。(239字)
247 6
|
1月前
|
存储 安全 芯片
【2026最新】U盘检测工具MyDiskTest安装使用教程(附安装包+图文步骤)
MyDiskTest是一款轻量免安装的Windows U盘/存储卡检测工具,专治“扩容盘”(虚标容量假盘),支持快速扩容检测、文件对比验证、读写速度测试及芯片真伪识别。纯中文界面,解压即用,操作简单,买新盘后验货首选。
|
8天前
|
边缘计算 大数据 定位技术
AIWCLOUD:免备案CDN,过移动屏蔽,不限内容在遥感大数据下
本文探讨免备案CDN如何成为“数字地球”的时空大数据分发引擎:通过COG瓦片优化、时空索引、WebAssembly边缘计算、矢量金字塔、实时火点告警及边缘脱密等技术,实现遥感数据的秒级分发、全球覆盖与合规应用。(239字)
107 7
|
18天前
|
人工智能 自然语言处理 API
懂车帝API接口全景解析:赋能汽车应用开发的利器 懂车帝为开发者精心打造了多维度、高价值的API接口体系,覆盖车辆数据获取、智能搜索及精准车型分析等核心场景。以下为2024年最新接口功能详解与技术实现指南:
懂车帝2024新版API全景解析:覆盖车型详情(item_get)、智能搜索(item_search)、SKU配置(item_sku)三大核心接口,支持OAuth2.0认证、多级查询与实时数据调用,日均调用量超1.2亿次,助力汽车应用高效开发。(239字)
|
18天前
|
数据采集 监控 前端开发
如何自动追踪 eBay 售价?Python 爬虫实战解析
如何自动追踪 eBay 售价?Python 爬虫实战解析
|
14天前
|
存储 监控 NoSQL
智能体构建:打破停机瓶颈:智能体Skill热更新、灰度发布与回滚机制全流程指南.142
本文详解大模型智能体的Skill热更新与灰度发布体系:将业务逻辑封装为独立Skill模块,通过SkillRegistry注册中心、DynamicLoader动态加载、GrayRouter灰度路由等组件,实现不停服更新、小范围验证、一键回滚,保障金融/政务等场景7×24高可用。
134 4
|
18天前
|
机器学习/深度学习 API
基于深度学习和YOLOv11的错题自动切分系统
基于深度学习和YOLOv11的错题自动切分系统
|
18天前
|
算法 PyTorch 算法框架/工具
基于PyTorch的EfficientDet进行水下目标检测 水下目标检测
项目概述:基于PyTorch的EfficientDet进行水下目标检测 在这个项目中,我们将通过实际比赛数据集演示如何训练最近开源的相对最先进的PyTorch版EfficientDet模型。本教程将涵盖从数据准备到模型训练、评估以及推断的全过程。值得注意的是,在本次实验中,我们没有采用任何数据增强技术或模型融合等后处理方法来提升模型精度;同样地,我们也未使用如UWGAN_UIE、水质迁移(WQT)、DG-YOLO或其他去雾算法对水下图像进行预处理。尽管这些技巧可能有助于提高识别准确率,但我们希望保持基础框架的纯粹性以专注于模型本身的性能。 1. 数据来源 我们的数据来自于科赛网举办的一次水下
|
18天前
|
存储 运维 关系型数据库
游戏行业十亿级用户行为分析:阿里云 AnalyticDB MySQL 解决方案
阿里云 AnalyticDB MySQL 版是游戏行业十亿级用户行为分析场景的首选实时数据仓库,支持每日 200 亿行数据实时写入,万亿级日志秒级分析,帮助波克城市等头部游戏公司实现成本降低 70-80%,查询性能提升 10 倍+。
326 7
|
2天前
|
数据采集 监控 数据管理
以 DCMM 为标尺,构建真正有"数据管理能力"的中台
本文剖析数据中台建设与DCMM评估脱节的根源,指出“建平台”不等于“建能力”。基于DCMM八域框架,厘清中台应重点承载数据标准、质量、架构等高耦合能力,并提出元数据统管、标准自动校验、质量闭环、血缘追溯四大实践路径,助力企业从DCMM二级迈向稳健级。