开发者社区 > 视觉智能 > 文字识别 > 正文

在文字识别OCR中,试卷识别切题,有时候文字识别出来了 但是位置信息都错了,返回来坐标能全是0的?

在文字识别OCR中,试卷识别切题,有时候文字识别出来了 但是位置信息都错了,返回来坐标能全是0的。 "prism_wordsInfo": [{
"pos": [{
"x": 0,
"y": 0
}, {
"x": 0,
"y": 0
}, {
"x": 0,
"y": 0
}, {
"x": 0,
"y": 0
}],
"word": ".(每季16526135)

展开
收起
小小鹿鹿鹿 2023-09-25 12:56:40 118 0
3 条回答
写回答
取消 提交回答
  • 试卷切题
    读光试卷切题可支持各学科的教辅试卷的结构化电子录入,将试卷中的题目进行自动化切分和结构化打标,并进行对应题目、题干、选项、答案等内容的结构化输出,能够大大释放手工录题成本,在教辅数字化、试卷批改有广泛应用。

    d7a5bad4f2edcbef17674104fbf3374d_p303409.png

    口算判题
    读光口算判题可以识别小学数学口算题目并给出题目判断结果。可支持整数的加减乘除四则运算、整数的混合运算、大小比较、最大数最小数等。

    fd9e8e0eceb1d68b15f62442cdeb052b_p303403.jpg

    整页试卷识别
    整页试卷识别是教育的基础OCR识别能力。支持K12全学科扫描场景的整页内容文字识别。接口支持印刷体文本及公式的OCR识别和坐标返回,此外,接口还可对题目中的配图位置进行检测并返回坐标位置。适用于对练习册、教辅、教材等内容进行整页识别与题目检索。

    994aba78d99b900ac65e6e0c480b456e_p303410.png

    精细版结构化识别
    试卷切题识别可将整页练习册、试卷或教辅中的题目进行自动切题,并识别出其中的文字内容和坐标位置。该产品按扫描版、实拍版、精细版划分,以适应不同的场景。

    90f77730f085b1c02754d3005012c941_p344210.png

    2023-09-26 08:50:13
    赞同 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,在这种情况下,可能是因为图片中文字的位置信息没有正确识别出来,导致返回的坐标都是0。这种情况下,建议对图片进行一些预处理,如图像增强、去除噪声等,以提高识别准确率和位置信息的精度。同时,也可以尝试更换OCR的识别模型或参数,以获得更好的识别结果。

    2023-09-26 08:42:43
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    image.png

    在文字识别OCR中,有时候会出现文字被正确识别但位置信息错误的情况。这可能是由于以下原因导致的:
    image.png

    1. 图像质量问题:如果试卷图像的质量较低,例如模糊、光照不均或者倾斜等问题,可能会导致OCR算法无法准确识别文字的位置。建议优化图像质量,确保图像清晰度和对比度,以提高文字检测和定位的准确性。

    2. OCR模型限制:OCR模型在处理复杂的场景时可能存在局限性。例如,特殊的字体、手写字、镶嵌在表格或图形中的文本等,可能会导致位置信息错误。尽管OCR技术已经取得了很大进展,但对于一些复杂场景仍有挑战。你可以尝试使用更先进的OCR模型或进行针对特定场景的定制训练,以改善识别结果。

    3. 算法参数调整:OCR算法中的参数设置可能会影响文字位置的准确性。你可以尝试调整相关参数,如文字检测的阈值、连通区域的最小面积等,以达到更好的位置识别结果。

    4. 后处理策略:有时OCR识别结果需要经过后处理步骤,如文本校正、文字排序等,以纠正位置错误。你可以尝试应用一些图像处理和文本处理的技术来改进位置信息。

    如果所有返回的坐标都是0,可能是由于某种问题在OCR流程中导致了识别失败。建议检查代码实现是否正确,并确保输入图像格式和参数设置正确。

    2023-09-25 13:10:00
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载