使用光学字符识别算法识别图像中的七段数字

本文涉及的产品
文档理解,结构化解析 100页
票据凭证识别,票据凭证识别 200次/月
通用文字识别,通用文字识别 200次/月
简介: 使用光学字符识别 (OCR) 识别图像中的七段数字。

​一、前言
使用光学字符识别 (OCR) 识别图像中的七段数字。在此示例中,将使用函数和区域属性来检测图像中的七段文本区域。然后,使用 OCR 识别检测到的文本区域中的七段数字。
二、读取图像
将图像读入工作区。
三、检测七段文本区域
使用该函数检测输入图像中的文本区域。该值是用于本地化图像中每个字符的区域阈值。该值是相关性阈值,用于定义将两个检测到的文本分组到单个实例中的分数。您可以通过修改区域和相关性阈值来微调检测结果。增加相关性阈值的值,以进行更多字级和字符级检测。

将关联阈值的值设置为 0.005。区域阈值的默认值为 0.4。输出是一组边界框,用于本地化输入图像中的文本区域。边界框指定图像中检测到的文本区域的空间坐标,并且是形式为 [、、、] 的向量。矢量指定检测到的区域的左上角和大小(以像素为单位)。

使用该函数在图像上绘制输出边界框。

显示输入图像和输出文本检测。
1.png

在输入图像中,七段文本区域占据最大面积。使用检测到的边界框的区域提取七段文本区域。

计算边界框的面积并找到具有最大面积的边界框。

从输入图像中提取具有最大边界框区域的文本区域。显示提取的七段文本区域。
2.png

四、识别七段数字
使用函数识别检测到的文本区域中的七段数字。将名称-值参数的值设置为“.输出是一个对象,其中包含有关已识别文本、识别置信度以及文本在原始图像中的位置的信息。

显示识别的七段数字。您可以注意到,OCR 检测到两个包围文本区域的边界框,并识别每个区域中的数字。
3.png

五、获得准确结果的挑战
准确识别七段数字的主要挑战是文本区域的分割和函数名称-值参数的选择。

作为预处理步骤,该函数执行二值化以将文本区域与背景分割开来。由于七段文本图像的性质,二值化文本区域具有断开连接的像素。如果沿垂直方向断开连接的像素之间的距离很大,,则该函数将输入图像视为具有多行文本。然后,该函数将每行文本分组到一个区域中,并识别每个区域中的数字。因此,识别结果可能不准确。在这种情况下,您可以通过为参数选择适当的值来提高识别精度。

六、使用参数改善结果
如果检测到的图像区域仅包含一行七段文本,则可以设置名称值参数,以获得良好的识别结果。

输入图像包含一组七段数字。计算 OCR 结果。

显示识别的七段数字。使用该函数在图像上绘制输出边界框。显示识别结果。您可以注意到图像中的七段文本区域已很好地定位,并且正确识别了数字。
4.png

目录
相关文章
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
阿里云人工智能平台 PAI 团队发表的图像编辑算法论文在 MM2024 上正式亮相发表。ACM MM(ACM国际多媒体会议)是国际多媒体领域的顶级会议,旨在为研究人员、工程师和行业专家提供一个交流平台,以展示在多媒体领域的最新研究成果、技术进展和应用案例。其主题涵盖了图像处理、视频分析、音频处理、社交媒体和多媒体系统等广泛领域。此次入选标志着阿里云人工智能平台 PAI 在图像编辑算法方面的研究获得了学术界的充分认可。
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
|
2月前
|
机器学习/深度学习 人工智能 算法
【MM2024】面向 StableDiffusion 的多目标图像编辑算法 VICTORIA
阿里云人工智能平台 PAI 团队与华南理工大学合作在国际多媒体顶级会议 ACM MM2024 上发表 VICTORIA 算法,这是一种面向 StableDiffusion 的多目标图像编辑算法。VICTORIA 通过文本依存关系来修正图像编辑过程中的交叉注意力图,从而确保关系对象的一致性,支持用户通过修改描述性提示一次性编辑多个目标。
|
2月前
|
算法 数据安全/隐私保护
织物图像的配准和拼接算法的MATLAB仿真,对比SIFT,SURF以及KAZE
本项目展示了织物瑕疵检测中的图像拼接技术,使用SIFT、SURF和KAZE三种算法。通过MATLAB2022a实现图像匹配、配准和拼接,最终检测并分类织物瑕疵。SIFT算法在不同尺度和旋转下保持不变性;SURF算法提高速度并保持鲁棒性;KAZE算法使用非线性扩散滤波器构建尺度空间,提供更先进的特征描述。展示视频无水印,代码含注释及操作步骤。
|
3月前
|
算法 数据可视化 数据安全/隐私保护
基于LK光流提取算法的图像序列晃动程度计算matlab仿真
该算法基于Lucas-Kanade光流方法,用于计算图像序列的晃动程度。通过计算相邻帧间的光流场并定义晃动程度指标(如RMS),可量化图像晃动。此版本适用于Matlab 2022a,提供详细中文注释与操作视频。完整代码无水印。
|
5月前
|
机器学习/深度学习 编解码 监控
算法金 | 深度学习图像增强方法总结
**图像增强技术概括** 图像增强聚焦于提升视觉效果和细节,广泛应用于医学、遥感等领域。空间域增强包括直方图均衡化(增强对比度)、对比度拉伸、灰度变换、平滑滤波(均值、中值)和锐化滤波(拉普拉斯、高通)。频率域增强利用傅里叶变换、小波变换,通过高频和低频滤波增强图像特征。现代方法涉及超分辨率重建、深度学习去噪(如CNN、Autoencoder)、图像修复(如GAN)和GANs驱动的多种图像处理任务。
192 14
算法金 | 深度学习图像增强方法总结
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|
5月前
|
算法
基于粒子群优化的图像融合算法matlab仿真
这是一个基于粒子群优化(PSO)的图像融合算法,旨在将彩色模糊图像与清晰灰度图像融合成彩色清晰图像。在MATLAB2022a中测试,算法通过PSO求解最优融合权值参数,经过多次迭代更新粒子速度和位置,以优化融合效果。核心代码展示了PSO的迭代过程及融合策略。最终,使用加权平均法融合图像,其中权重由PSO计算得出。该算法体现了PSO在图像融合领域的高效性和融合质量。
|
6月前
|
机器学习/深度学习 人工智能 算法
【CVPR2024】面向StableDiffusion的编辑算法FreePromptEditing,提升图像编辑效果
近日,阿里云人工智能平台PAI与华南理工大学贾奎教授团队合作在深度学习顶级会议 CVPR2024 上发表 FPE(Free-Prompt-Editing) 算法,这是一种面向StableDiffusion的图像编辑算法。在这篇论文中,StableDiffusion可用于实现图像编辑的本质被挖掘,解释证明了基于StableDiffusion编辑的算法本质,并基于此设计了新的图像编辑算法,大幅度提升了图像编辑的效率。
|
4月前
|
算法 前端开发 计算机视觉
基于均值坐标(Mean-Value Coordinates)的图像融合算法的优化实现
基于均值坐标(Mean-Value Coordinates)的图像融合算法的优化实现
49 0
|
4月前
|
自然语言处理 并行计算 算法
基于均值坐标(Mean-Value Coordinates)的图像融合算法的具体实现
基于均值坐标(Mean-Value Coordinates)的图像融合算法的具体实现
51 0