文字识别ocr中教育场景识别，是否支持以Word文档的形式批量导入题目呢？

文字识别ocr中教育场景识别，是否支持以Word文档的形式批量导入题目呢？题目中除了常规文字外，还涉及理工科公式和特殊字符以及配图，并且批量导入后可以进行切题识别（即判断该题结束）。“不支持批量导入”是指只是不支持批量导入吗？但可以识别Word文档里面题目并且可做切题识别?我看教育场景链接里面是有“试卷切题识别”的，“试卷切题识别可将整页练习册、试卷或教辅中的题目进行自动切题，并识别出其中的文字内容和坐标位置。该产品按扫描版、实拍版、精细版划分，以适应不同的场景。”
但是不清楚是否仅适用用于图片的识别，想确认一下word文档内的题目是否也支持？

展开

收起

小小鹿鹿鹿 2023-11-20 21:44:12 67 0

3 条回答

写回答

取消提交回答

sunrr

阿里云的文字识别（OCR）服务在教育场景中的应用，包括试卷切题识别，主要是针对图片或者扫描件进行识别的。对于Word文档的形式，理论上可以通过转换为图片或者扫描件后进行识别。

2023-11-29 14:57:40

赞同展开评论打赏
小小杳杳杳

目前暂不支持批量导入，我们有教育场景的识别能力可以在这里测试一下：
https://duguang.aliyun.com/experience?type=edu 。只能单张识别。目前支持上传的文件格式.png / .jpg / .jpeg / .jpe / .bmp / .gif / .tiff / .tif / .webp。word文档暂不支持哈。此回答来自钉群【官方】阿里云OCR公共云客户交流群。

2023-11-21 23:56:39

赞同展开评论打赏
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

文字识别OCR工具支持对多种格式的文件进行识别，包括Word文档在内的大多数常见文件格式都是可以被支持的。一般来说，在教育场景下识别Word文档里的题目时，您可以将整个Word文档上传到识别工具，并进行批量处理。
但是请注意，OCR工具并不一定能够完美识别Word文档中的所有元素，例如公式和特殊字符等等，因为这些元素可能比较复杂并且需要特殊的算法才能够正确识别。而且，OCR工具也不一定能正确识别图像或图表等非文字类元素。对于这种情况，您可能需要手动调整输出结果或者寻找其他解决方案。
至于批量导入是否支持切题识别，则要看您所使用的具体工具和它的配置情况。一般来说，OCR工具应该能够支持切题识别，并且可以在较短时间内完成整个过程

2023-11-21 21:51:24

赞同展开评论打赏