开源ocr库-转载

简介: 3月8日 开源的OCR库,Opensourced OCR library 突然想起如何做一个论坛的发帖机,但是现在多数都要图片认证,需要一个OCR库来识别图片。于是在网上找了找,还真是有很多实现: OCRE, OCR Easy, http://lem.

38

开源的OCR库,Opensourced OCR library

突然想起如何做一个论坛的发帖机,但是现在多数都要图片认证,需要一个OCR库来识别图片。于是在网上找了找,还真是有很多实现:

  1. Ocrad, based on a feature extraction, http://directory.fsf.org/ocrad.html
  2. OCRchie: Modular Optical Character Recognition Software http://http.cs.berkeley.edu/~fateman/kathey/ocrchie.html
  3. sf.net上还有很多正在进行的项目,不过大多数还停留在设想阶段

现在的问题,是测试这些库。不过猜测,这些OCR对付国内的网站还行,像MSN这样的图片肯定无效了。

下载这些程序分别测试了一下,

gocrocrad稍作修改可在Windows下编译运行。gocrvc6, ocradgcc

OCRE,OCRchieclara OCR需要X windowgtk不太好编译。

测试了一下sina, baidu, taobao,他们都或多或少做了干扰噪音,所以基本不能识别。

gocr能够正确识别的最好情况是能够正确识别4个数字中的3个。

   

看来在没有对图片作预处理之前,这种识别方式基本不可行。

还没有开始就已经结束了。

目录
相关文章
|
19小时前
|
人工智能 文字识别 异构计算
关于github开源ocr项目的疑问
小白尝试Python OCR学习,遇到报错。尝试Paddle OCR部署失败,Tesseract OCR在Colab误操作后恢复失败。EasyOCR在Colab和阿里天池Notebook成功,但GPU资源不足。其他平台部署不顺,决定使用WebUI或阿里云轻应用。求教OCR项目部署到本地及简单OCR项目推荐。
31 2
|
19小时前
|
文字识别 前端开发 JavaScript
Star33.1k!推荐一个基于网页的OCR(光学字符识别)引擎库
想要在前端解决图像识别的兄弟,可以到 Github 上下载Tesseract.js库,安装和相关学习文档都能下载到,实在获取不到的兄弟找V哥发给你,假期第二天,出去放松的同时也可以看看 V 哥的文章,祝大家玩得开心。
|
19小时前
|
文字识别 C# 开发者
WPF开源的一款免费、开箱即用的翻译、OCR工具
WPF开源的一款免费、开箱即用的翻译、OCR工具
|
19小时前
|
文字识别 算法 数据库
开源OCR模型DIY票证信息抽取
票证检测矫正模型在实际生活中有着广泛的需求,例如信息抽取、图像质量判断、证件扫描、票据审计等领等场景,可以大幅提高工作效率和准确性。
|
文字识别 Linux iOS开发
python开发:开源pytesseract文字识别
python开发:开源pytesseract文字识别
161 0
|
文字识别 Shell Docker
通过容器搭建开源文字识别/OCR服务
通过容器搭建开源文字识别/OCR服务
1577 0
|
文字识别
GitHub开源:支持100多种语言的OCR文字识别
GitHub开源:支持100多种语言的OCR文字识别
GitHub开源:支持100多种语言的OCR文字识别
|
机器学习/深度学习 编解码 文字识别
GitHub开源:17M超轻量级中文OCR模型、支持NCNN推理
GitHub开源:17M超轻量级中文OCR模型、支持NCNN推理
GitHub开源:17M超轻量级中文OCR模型、支持NCNN推理
|
文字识别 Docker 容器
开源 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用
开源 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用 一 背景 在日常的一些工作中,偶尔也需要我们把图片转换为文字。目前大部分办公软件还无法实现类似的功能,因此遇到类似的问题时,我们只能自己动手解决。
3648 0
|
19小时前
|
文字识别 容器
文字识别OCR常见问题之本地部署如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
64 3

热门文章

最新文章