开源ocr库-转载

本文涉及的产品
票据凭证识别,票据凭证识别 200次/月
自定义KV模板,自定义KV模板 500次/账号
个人证照识别,个人证照识别 200次/月
简介: 3月8日 开源的OCR库,Opensourced OCR library 突然想起如何做一个论坛的发帖机,但是现在多数都要图片认证,需要一个OCR库来识别图片。于是在网上找了找,还真是有很多实现: OCRE, OCR Easy, http://lem.

38

开源的OCR库,Opensourced OCR library

突然想起如何做一个论坛的发帖机,但是现在多数都要图片认证,需要一个OCR库来识别图片。于是在网上找了找,还真是有很多实现:

  1. Ocrad, based on a feature extraction, http://directory.fsf.org/ocrad.html
  2. OCRchie: Modular Optical Character Recognition Software http://http.cs.berkeley.edu/~fateman/kathey/ocrchie.html
  3. sf.net上还有很多正在进行的项目,不过大多数还停留在设想阶段

现在的问题,是测试这些库。不过猜测,这些OCR对付国内的网站还行,像MSN这样的图片肯定无效了。

下载这些程序分别测试了一下,

gocrocrad稍作修改可在Windows下编译运行。gocrvc6, ocradgcc

OCRE,OCRchieclara OCR需要X windowgtk不太好编译。

测试了一下sina, baidu, taobao,他们都或多或少做了干扰噪音,所以基本不能识别。

gocr能够正确识别的最好情况是能够正确识别4个数字中的3个。

   

看来在没有对图片作预处理之前,这种识别方式基本不可行。

还没有开始就已经结束了。

目录
相关文章
|
6月前
|
文字识别 异构计算 Python
关于Github中开源OCR项目的实验过程与思考
新手尝试Git clone Python OCR项目,遇到各种报错。测试了Paddle OCR、Tesseract OCR和EasyOCR。Paddle OCR因平台限制未能在Notebook部署,Tesseract OCR在Colab成功但无法复现。EasyOCR最终在阿里云天池和Colab部署成功,但天池GPU资源不足。建议使用魔搭社区的实例,阿里云提供免费OCR服务。寻求简单OCR项目推荐。附EasyOCR安装和使用代码。
237 2
|
2月前
|
编解码 人工智能 文字识别
阶跃星辰开源GOT-OCR2.0:统一端到端模型,魔搭一站式推理微调最佳实践来啦!
GOT来促进OCR-2.0的到来。该模型具有580百万参数,是一个统一、优雅和端到端的模型,由高压缩编码器和长上下文解码器组成。
阶跃星辰开源GOT-OCR2.0:统一端到端模型,魔搭一站式推理微调最佳实践来啦!
|
3月前
|
机器学习/深度学习 人工智能 文字识别
轻松识别文字,这款Python OCR库支持超过80种语言
轻松识别文字,这款Python OCR库支持超过80种语言
|
6月前
|
文字识别 前端开发 JavaScript
Star33.1k!推荐一个基于网页的OCR(光学字符识别)引擎库
想要在前端解决图像识别的兄弟,可以到 Github 上下载Tesseract.js库,安装和相关学习文档都能下载到,实在获取不到的兄弟找V哥发给你,假期第二天,出去放松的同时也可以看看 V 哥的文章,祝大家玩得开心。
117 0
|
6月前
|
文字识别 C# 开发者
WPF开源的一款免费、开箱即用的翻译、OCR工具
WPF开源的一款免费、开箱即用的翻译、OCR工具
114 0
|
6月前
|
文字识别 算法 数据库
开源OCR模型DIY票证信息抽取
票证检测矫正模型在实际生活中有着广泛的需求,例如信息抽取、图像质量判断、证件扫描、票据审计等领等场景,可以大幅提高工作效率和准确性。
|
文字识别 Linux iOS开发
python开发:开源pytesseract文字识别
python开发:开源pytesseract文字识别
197 0
|
文字识别 API C#
一个基于C#开发的轻量级OCR文字识别开源工具
一个基于C#开发的Windows OCR工具,通过截图的方式就可以自动识别文字,并自动拷贝文字。
1834 0
一个基于C#开发的轻量级OCR文字识别开源工具
|
文字识别 Shell Docker
通过容器搭建开源文字识别/OCR服务
通过容器搭建开源文字识别/OCR服务
2359 0
|
文字识别
GitHub开源:支持100多种语言的OCR文字识别
GitHub开源:支持100多种语言的OCR文字识别
GitHub开源:支持100多种语言的OCR文字识别

热门文章

最新文章

  • 1
    【Python】已解决:Python正确安装文字识别库EasyOCR
    458
  • 2
    提升爬虫OCR识别率:解决嘈杂验证码问题
    132
  • 3
    文本,文字识别14,身份证和车牌识别接口
    29
  • 4
    文本,文字识别13,参数校验,实现参数校验,使用@Valid注解
    27
  • 5
    文本,文字识别12,接口返回值和异常封装,一个好的接口,应该包括,错误码,提示信息,返回的数据,应该知道出错,错在哪里,抛出业务异常应该怎样解决?出现业务异常的时候,抛出业务异常,全局异常处理
    37
  • 6
    文本,文识11,解析OCR结果,paddOCR返回的数据,接口返回的数据有code,data,OCR返回是JSON的数据,得到JSON数据先安装依赖,Base64转换工具网站在21.14
    101
  • 7
    文本,文识10,springBoot提供RestTemplate以调用Flask OCR接口,调用flask实现ocr接口,用paddleocr进行图片识别云服务技术,单个paddleocr接口有影响
    93
  • 8
    文本,文识08图片保存()上,最方便在于整体生成代码,serivce及实体类,base64编码保存图片文件,调用flask实现内部ocr接口,通过paddleocr识别,解析结果,base64转图片
    45
  • 9
    文本,文字识别07,SpringBoot服务开发-入参和返回值,编写接口的时候,要注意识别的文字返回的是多行,因此必须是List集合,Bean层,及实体类的搭建
    49
  • 10
    文本,文字识别,Flask实现内部接口开发,OCR外部接口的开发,如何开发一个识别接口,通过post调用,参数是图片的路径,内部调用,直接传图片路径就行
    64
  • 下一篇
    无影云桌面