开发者社区> 问答> 正文

ocr RecognizeAdvanced - 全文识别高精版 已经识别成功

但是拿到数据怎么处理合适呢,看着数据没有具体的一个标识,没法那数据进行封装

展开
收起
游客gruy5ul46e5lc 2023-08-10 17:08:17 80 0
2 条回答
写回答
取消 提交回答
  • 发表文章、提出问题、分享经验、结交志同道合的朋友

    OCR RecognizeAdvanced 返回参数Data是一个 JSON 格式的对象
    image.png

    在Java中,你可以使用类来封装这个JSON数据。

    首先,创建一个主类 StructuredData,包含了需要的字段和嵌套的类:

    import java.util.List;
    
    public class StructuredData {
        private String content;
        private Size size;
        private String prism_version;
        private int prism_wnum;
        private List<WordInfo> wordsInfo;
    
        // getters and setters
        // ...
    }
    
    class Size {
        private int height;
        private int width;
    
        // getters and setters
        // ...
    }
    
    class WordInfo {
        private int angle;
        private int direction;
        private Size size;
        private List<Position> pos;
        private int probability;
        private String text;
        private Position position_center;
    
        // getters and setters
        // ...
    }
    
    class Position {
        private int x;
        private int y;
    
        // getters and setters
        // ...
    }
    

    然后,你可以在你的应用程序中使用这些类来解析和封装JSON数据:

    import com.fasterxml.jackson.databind.ObjectMapper;
    
    public class Main {
        public static void main(String[] args) throws Exception {
            String jsonData = "{\"content\":\"...\"}"; // Your JSON data here
            ObjectMapper objectMapper = new ObjectMapper();
            StructuredData structuredData = objectMapper.readValue(jsonData, StructuredData.class);
    
            // Access and use the structured data
            System.out.println(structuredData.getContent());
            System.out.println(structuredData.getSize().getHeight());
            // ... and so on
        }
    }
    
    2023-08-10 22:53:16
    赞同 展开评论 打赏
  • 如果您使用OCR的全文识别高精版成功地提取了数据,但是在处理数据时遇到了困难,以下是一些建议:

    1. 数据结构化:尝试将提取的数据进行结构化处理,根据内容的特点将其划分为各个字段或标识。例如,可以根据关键词、格式或位置等规则,将数据划分为姓名、日期、地址等字段。

    2. 数据清洗和整理:对提取的数据进行清洗和整理。这可能包括去除多余的空格、标点符号或其他无用字符;修复或纠正提取错误的数据;合并或拆分数据项等操作。

    3. 数据验证:根据业务需求和数据的准确性要求,对提取的数据进行验证。可以使用数据验证规则、算法或参考现有的数据进行比对,以确保提取的数据的准确性和完整性。

    4. 数据存储和封装:选择合适的数据存储方式,如数据库、电子表格或自定义数据结构。根据业务需求,将结构化和清洗后的数据封装成适当的数据对象或模型。

    5. 数据应用和分析:根据实际需求,利用提取的数据进行进一步的应用和分析。这可能包括数据分析、报表生成、信息检索、机器学习等。

    2023-08-10 22:21:24
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载