文本,文字识别,Flask实现内部接口开发,OCR外部接口的开发,如何开发一个识别接口,通过post调用,参数是图片的路径,内部调用,直接传图片路径就行

本文涉及的产品
票据凭证识别,票据凭证识别 200次/月
通用文字识别,通用文字识别 200次/月
文档理解,结构化解析 100页
简介: 文本,文字识别,Flask实现内部接口开发,OCR外部接口的开发,如何开发一个识别接口,通过post调用,参数是图片的路径,内部调用,直接传图片路径就行

资源链接:

Flask实现内部接口-内部接口开发_哔哩哔哩_bilibili

第一步新建一个Web接口

第二步 这里设置OCR_WEB

第三步 我们把我们之前写的代码给他Copy一下

没用的代码给他删除一下

这里我们要通过post调用,参数是图片的路径,第一步先创建一个OCR的对象

传入图片路径,将传入的图片路径转换成JSON

写上路径,打印一下OCR的方法

cls默认可以识别180度的字符

这样就把图片的返回结果给整理好了

改一下,让他符合命名规范

接下来测试一下接口看看怎么样

复制一下路径

把路径拷一下

up主打印标识忘了,接口访问成功

打印让他规范一下

完整样子

ocr_web资料

import json
import logging
 
import requests
from flask import Flask, request, jsonify
from paddleocr import PaddleOCR
 
 
def init_log():
    # 设置打印到控制台的格式和等级
    logging.basicConfig(format='%(asctime)s %(filename)s %(levelname)s %(message)s', datefmt='%a %d %b %Y %H:%M:%S',
                        level=logging.INFO)
    # 设置输出到的文件和编码
    file_handler = logging.FileHandler("ocr.log", encoding="utf-8")
    # 设置输出等级
    file_handler.setLevel(logging.INFO)
    # 设置输出到文件的日志格式
    file_handler.setFormatter(logging.Formatter('%(asctime)s %(filename)s %(levelname)s %(message)s'))
    logger = logging.getLogger()
    logger.handlers.append(file_handler)
 
 
init_log()
# name 是python中的特殊变量,如果文件作为主程序执行(例如直接执行),那么__name__的值就是__main__,如果是被其它模块引入,那么__name__就是模块名称
app = Flask(__name__)
 
# 创建一个PaddleOCR对象,使用方向识别器,不使用gpu进行技术,通过cpu进行计算。PaddleOCR我们只需要初始化一次,会将模型加载到内存,会将相关模型下载如果是第一次使用
ocr = PaddleOCR(usr_angle_cls=True, use_gpu=False)
 
@app.route("/ocr", methods=["POST"])
def learn_post_method():
    try:
        data = json.loads(request.data)
        img_path = data["imgPath"]
        logging.info("ocr imgPath : %s", img_path)
        ocr_result = ocr.ocr(img_path)
        return jsonify({"code": 0, "msg": "ok", "data": ocr_result}), 200
    except Exception as e:
        logging.error("ocr error: %s", str(e))
        ocr_result = {"code": -1, "msg": str(e)}
    return jsonify(ocr_result), 200
 
if __name__ == '__main__':
    # 可以返回中文字符
    app.config['JSON_AS_ASCII'] = False
    app.run(host='0.0.0.0', debug=True, port=8888)
相关文章
|
3月前
|
人工智能 编解码 文字识别
谷歌放大招!多模态模型PaliGemma 2 Mix上线:通吃问答+OCR+检测等多项视觉理解任务,28B参数无需额外加载模型
PaliGemma 2 Mix 是谷歌DeepMind发布的多任务视觉语言模型,支持图像描述、OCR、目标检测等功能,适用于文档理解、科学问题解答等场景。
135 2
|
4月前
|
人工智能 文字识别 API
moonshot-v1-vision-preview:月之暗面Kimi推出多模态视觉理解模型,支持图像识别、OCR文字识别、数据提取
moonshot-v1-vision-preview 是月之暗面推出的多模态图片理解模型,具备强大的图像识别、OCR文字识别和数据提取能力,支持API调用,适用于多种应用场景。
346 6
moonshot-v1-vision-preview:月之暗面Kimi推出多模态视觉理解模型,支持图像识别、OCR文字识别、数据提取
|
8月前
|
数据库 Python
如何使用Flask进行开发?
【9月更文挑战第1天】如何使用Flask进行开发?
77 3
|
6月前
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。
509 1
|
9月前
|
SQL 缓存 数据库
神秘编程领域惊现宝藏!Flask 扩展生态究竟隐藏着怎样的神奇力量?快来揭开提升开发效率的秘密!
【8月更文挑战第31天】在 Flask 的世界里,其简洁而强大的核心框架搭配丰富多彩的扩展生态,为开发者带来了无尽可能性。从数据库集成到用户认证,从表单验证到缓存管理,Flask 提供了众多高质量插件,如 Flask-SQLAlchemy、Flask-WTF 和 Flask-Login,大幅提升了开发效率和代码质量。这些扩展如同宝库中的珍宝,等待着我们去探索和利用,但需谨慎选择以避免不必要的复杂性和性能问题。总之,Flask 的扩展生态助力我们更高效地开发 Web 应用,创造更多优秀作品。
104 0
|
9月前
|
机器学习/深度学习 文字识别 算法
百度飞桨(PaddlePaddle) - PaddleHub OCR 文字识别简单使用
百度飞桨(PaddlePaddle) - PaddleHub OCR 文字识别简单使用
594 0
|
10月前
|
文字识别
印刷文字识别使用问题之是否支持非标发票的识别
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
10月前
|
人工智能 文字识别 开发工具
印刷文字识别使用问题之是否支持识别并返回文字在图片中的位置信息
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
10月前
|
人工智能 JSON 文字识别
印刷文字识别使用问题之如何数电发票进行识别
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
10月前
|
文字识别 数据安全/隐私保护 iOS开发
印刷文字识别使用问题之如何识别礼品册上的卡号、密码信息
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。

热门文章

最新文章