Eolink——通用文字识别OCR接口示例

简介: Eolink——通用文字识别OCR接口示例


过程演示

一、功能位置

我们选择【数据智能】来测试一下,智能的,应该会比较好玩。

进入选项后会出现一个【通用文字识别OCR】,一看就知道是图片识别文字。我们用来测试一下肯定没问题。也让自己变成AI选手。

一定要登陆啊,不然是没法操作的。

这里我们可以点击免费试用,也可以点击购买套餐,都包含这个免费的API接口测试。

购买中有免费试用100次。我已经申请了,就没有这个选项了。价格还是很公道的越多价格越低。

购买完成后可以看到:

上图中我们在【通用文字识别ORC】的右侧可以看到三个选项

【API文档】

【测试】

【配置额度】

我们挨个看看,先来看【API文档】

二、通用文字识别ORC——【API文档】

测试效果:

应用场景

  • 拍照/截图识别
    使用通用文字识别技术,实现拍照文字识别、相册图片文字识别和截图文字识别,可应用于搜索、书摘、笔记、翻译等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户使用体验。
  • 内容审核与监管
    自动提取图像中的文字内容,结合文本审核技术识别违规内容,提示相应风险,协助进行违规处理,可应用于电商广告审核、舆情监管等场景,帮助企业有效规避业务风险。
  • 视频内容分析
    检测识别视频中的字幕、标题、弹幕等文字内容,并根据文字位置判断文字类型,可应用于视频分类和标签提取、视频内容审核、营销分析等场景,有效提升内容分类、检索的效率。
  • 纸质文档电子化
    识别提取各类医疗单据、金融财税票据、法律卷宗等纸质文档中的文字信息,并可基于位置信息进行比对、结构化处理,提高信息录入、存档、检索的效率。

特色优势

  • 准确率高
    针对图片模糊、倾斜、翻转等情况进行专项优化,鲁棒性强,支持万字大字库,总体识别准确率高达99%。
  • 服务稳定
    高可靠,弹性可伸缩,高并发承载的云端服务,服务可用性高达99%。
  • 支持多语种识别
    通用文字识别支持 中,英,法,德,日,韩文。

API文档

我们选择API文档后可以看到API列表的介绍页面,这里显示了我们要测试的POST协议的接口路径以及Header的头部说明。

请求体中对所有的参数都给了说明,看看说明的哪一列,我的天啊,解释的超详细。

神技【★★★★★

作为程序员,很多时候是不能指望测试人员的,还是得自己搞,有个这个就挨个导出来,根本不需要写代码,就一顿复制粘贴实在是爽。

我通常使用requests来做请求。

代码复制粘贴填写token就能用,这个也忒方便了,超级爽歪歪。

import requests
url = "https://eolink.o.apispace.com/ocrbase/ocr/v1/base"
payload = {"image": "", "url": "https://www.apispace.com/assets/images/free_try.jpg", "language": "CHN_ENG"}
headers = {
    "X-APISpace-Token": "",  # 填写自己的token
    "Authorization-Type": "apikey",
    "Content-Type": "application/json"
}
response = requests.request("POST", url, json=payload, headers=headers)
print(response.text)

贴心了给了各种一键操作。

回参介绍

我们主要需要的是word这个返回餐,根据这个进行解析就行。

后面我们要进行具体的测试了。

三、通用文字识别ORC——【测试】

1、操作位置

进入到我们正式的测试步骤,我们先回到【我的API】点击【通用文字识别OCR】的【测试】选项。

这是我们的测试面板:

面板介绍的很全,也都是中文的,一目了然。这里如果没有Token的话返回到【我的API】当中,左侧选择【访问控制】,这里面会有【添加新Token】的操作,我们可以直接创建一个Token给这个API使用。

2、创建Token的位置

3、测试用例解析

这里使用默认的图片地址进行测试,

我用本地进行测试,也是完全OK的呢。

4、替换图片路径(羊了个羊第二关)

我选了一张超级较难的图,图片是png的透明背景图,文字有水平,有垂直,有倾斜,有弧度,有一般符号,有特殊符号,有人造符号。。。总之超级难。

图片地址:https://www.eolink.com/assets/images/index/eolink-products-mobile.png

这个图片透明的,并且是旋转字样。

超难的文字识别

5、测试结果

我们测试完成后发现返回的结果几乎将所有的文字都能正确解析,包括斜体的,倒置的文字都行,这个AI模型还是非常棒的。

完成度计算:

总计15个词,实际解析13个词。在这种难度下达到这个水准还是非常可以的。

6、代码测试位置:

我们只需要格式化一下数据就能做匹配,建议使用json,直接import json进行loads处理就好,很方便的。

四、通用文字识别ORC——【配额设置】

这个功能在【我们API】中最右侧,点击【我的配额】

总结

我们完整的测试了Eolink的第三方API【通用文字识别OCR】,整个测试的结果还是非常喜人的。

1、测试过程流畅,没有卡顿处

2、所有操作功能位置明显

3、提示内容中文且完整

4、接口解析反馈结果正确率较高

有空再测测其它功能。挺好用的神器,必须推荐给大家。

体验地址:Eolink-api接口管理平台_api管理系统_接口自动化平台

相关文章
|
8月前
|
机器学习/深度学习 文字识别 Linux
Umi-OCR_文字识别工具 免安装使用教程(附下载安装包)!永久免费,开源离线OCR识别软件下载
Umi-OCR是一款开源免费、支持离线运行的高精度OCR文字识别工具,基于深度学习技术,可快速识别中文、英文、日文等多种语言。无需联网,保护隐私,适用于Windows和Linux系统,解压即用,操作简便,是处理图片转文本的理想选择。
5270 7
|
机器学习/深度学习 文字识别 自然语言处理
OCR技术:解锁文字识别的无限可能
OCR(光学字符识别)技术是数字化浪潮中的关键工具,可将纸质文档、手写笔记或复杂背景下的文字图像转化为可编辑文本。本文从图像采集、预处理、字符识别到文本校正,全面解析OCR技术的原理,并探讨其在智能办公、智慧交通、便捷生活等领域的广泛应用。未来,OCR将与自然语言处理、计算机视觉等技术深度融合,推动智能化和综合化发展。通过开放生态系统和政策支持,开发者可探索更多创新场景,如古籍数字化、盲人阅读等,为社会带来更多价值。
2232 57
|
12月前
|
人工智能 文字识别 自然语言处理
熊猫 OCR 识别软件下载,支持截图 OCR、PDF 识别、多语言翻译的免费全能工具,熊猫OCR识别
本文介绍了几款实用的图文识别软件,包括熊猫OCR、Umi-OCR和天若OCR_本地版。熊猫OCR功能强大,支持多窗口操作、AI找图找色、OCR识别等;Umi-OCR免费且高效,具备截图OCR、批量处理等功能;天若OCR界面简洁,适合快速文字识别。文章还提供了下载链接及软件特点、界面展示等内容,便于用户根据需求选择合适的工具。
1439 36
|
人工智能 文字识别 API
moonshot-v1-vision-preview:月之暗面Kimi推出多模态视觉理解模型,支持图像识别、OCR文字识别、数据提取
moonshot-v1-vision-preview 是月之暗面推出的多模态图片理解模型,具备强大的图像识别、OCR文字识别和数据提取能力,支持API调用,适用于多种应用场景。
2843 6
moonshot-v1-vision-preview:月之暗面Kimi推出多模态视觉理解模型,支持图像识别、OCR文字识别、数据提取
|
文字识别 UED Python
对双栏 | 单双栏混合 | 图表文字混合的复杂布局的图片OCR识别(对布局复杂的整个pdf进行OCR识别)
这个故事告诉我们要多尝试不同的库和引擎,尤其是需求比较偏门或者少见的时候。同一个方向不同的库所擅长的领域是不一样的。 博客不应该只有代码和解决方案,重点应该在于给出解决方案的同时分享思维模式,只有思维才能可持续地解决问题,只有思维才是真正值得学习和分享的核心要素。如果这篇博客能给您带来一点帮助,麻烦您点个赞支持一下,还可以收藏起来以备不时之需,有疑问和错误欢迎在评论区指出~
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。
2103 1
|
机器学习/深度学习 文字识别 算法
百度飞桨(PaddlePaddle) - PaddleHub OCR 文字识别简单使用
百度飞桨(PaddlePaddle) - PaddleHub OCR 文字识别简单使用
1277 0
|
人工智能 文字识别 开发工具
印刷文字识别使用问题之是否支持识别并返回文字在图片中的位置信息
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
人工智能 JSON 文字识别
印刷文字识别使用问题之如何数电发票进行识别
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
文字识别 数据安全/隐私保护 iOS开发
印刷文字识别使用问题之如何识别礼品册上的卡号、密码信息
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。

热门文章

最新文章