最简单的屏幕OCR文字识别

本文涉及的产品
小语种识别,小语种识别 200次/月
教育场景识别,教育场景识别 200次/月
票据凭证识别,票据凭证识别 200次/月
简介: 使用office2003附带的MODI可以进行OCR文字识别,不需要取样,使用简单,识别率很不错。
使用office2003附带的MODI可以进行OCR文字识别,不需要取样,使用简单,识别率很不错。
适合用于识别比较规范的文本。缺点是必须安装office2003及Microsoft Document Imaging组件。
这种方法适合于普通文字识别,不太适合做验证码识别。
验证码识别请参考教程: http://www.yhhe.net/ape/book/fap/f2/ix.html
本程序使用了comx插件,请参考贴子: http://www.yhhe.net/bbs/dispbbs.asp?BoardID=4&ID=179&replyID=
下面是演示源代码:
下载模拟精灵:  http://www.yhhe.net/Fairy_Ape.exe
打开模拟精灵,把下面的代码粘贴到源码编辑,按F5运行即可。

img = image.new(); --创建一个图片对象
img:capture( 0, 100, 200, 300, 400); --抓屏,范围x=100,y=200,宽=300,高=400
img:save(_LASDIR.. " // test.bmp");  --保存图片到脚本目录(也就是_LASDIR)下
    
--导入comx插件
import( "std");
import2( "comx", "http://www.yhhe.net/ape/import/comx/comx.dll"); 
 
--创建MODI对象(必须安装office2003中的Microsoft Document Imaging组件)
mdoc = comx.CreateObject( "MODI.Document");
if( not mdoc) then
    win.messageBox( "请将安装office2003及Microsoft Document Imaging组件", "屏幕ocr文字识别")
     return
    false;
end;
 
--导入图片
mdoc:Create(_LASDIR.. " // test.bmp");
--进行OCR识别,参数分别为语言ID,是否自动诱转,是否自动拉伸
mdoc:OCR( 0x804,_FALSE,_FALSE);
 
local mi = mdoc.Images( 0);
--快速获取取全部文本
win.messageBox(mi.Layout.Text, "mdoc.Images(0).Layout.Text");
 
--获取字符详细信息
local word = mi.Layout.Words( 0)
local str =   "Id: " .. word.Id ..  " /r/n "
   
str = str ..  "Line Id: " .. word.LineId ..  " /r/n ";
str = str ..  "Region Id: " .. word.RegionId ..  " /r/n ";
str = str ..  "Font Id: " .. word.FontId ..  " /r/n ";
str = str ..  "Recognition confidence: " .. word.RecognitionConfidence ..  " /r/n ";
str = str ..  "Text: " .. word.Text;
 
win.messageBox(str, "mdoc.Images(0).Layout.Words(0)")
 
mdoc:OCR 函数的第一个参数指定语言ID
在简体中文office中可选的语言ID有:
自动选择 0x800
英语 9
简体中文 0x804
在繁体中文office中可选的语言ID有:
自动选择 0x800
英语 9
繁体中文 0x404
正确的指定语言ID可以提高识别率。
如果mdoc:OCR 没有在图片中找到文字,会报错并终止模拟程序。
目录
相关文章
|
1月前
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。
|
5月前
|
文字识别
印刷文字识别使用问题之影响印刷体文字识别率包括哪些
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
5月前
|
文字识别 API 开发工具
印刷文字识别使用问题之如何提高OCR的识别率
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
4月前
|
机器学习/深度学习 文字识别 算法
百度飞桨(PaddlePaddle) - PaddleHub OCR 文字识别简单使用
百度飞桨(PaddlePaddle) - PaddleHub OCR 文字识别简单使用
323 0
|
5月前
|
存储 文字识别 算法
印刷文字识别使用问题之电商图片文字识别是否支持一次调用识别多张图片
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
5月前
|
文字识别 API
印刷文字识别使用问题之遇到个人证照识别文字识别错误,该怎么办
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
5月前
|
文字识别 Java API
印刷文字识别操作报错合集之复制文字识别OCR的标注任务时出现报错,该怎么办
在使用印刷文字识别(OCR)服务时,可能会遇到各种错误。例如:1.Java异常、2.配置文件错误、3.服务未开通、4.HTTP错误码、5.权限问题(403 Forbidden)、6.调用拒绝(Refused)、7.智能纠错问题、8.图片质量或格式问题,以下是一些常见错误及其可能的原因和解决方案的合集。
|
5月前
|
文字识别
印刷文字识别使用问题之是否支持非标发票的识别
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
5月前
|
人工智能 文字识别 开发工具
印刷文字识别使用问题之是否支持识别并返回文字在图片中的位置信息
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
5月前
|
人工智能 JSON 文字识别
印刷文字识别使用问题之如何数电发票进行识别
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
下一篇
DataWorks