文字识别ocr中教育场景识别,是否支持以Word文档的形式批量导入题目呢?题目中除了常规文字外,还涉及理工科公式和特殊字符以及配图,并且批量导入后可以进行切题识别(即判断该题结束)。“不支持批量导入”是指只是不支持批量导入吗?但可以识别Word文档里面题目并且可做切题识别?我看教育场景链接里面是有“试卷切题识别”的,“试卷切题识别可将整页练习册、试卷或教辅中的题目进行自动切题,并识别出其中的文字内容和坐标位置。该产品按扫描版、实拍版、精细版划分,以适应不同的场景。”
但是不清楚是否仅适用用于图片的识别,想确认一下word文档内的题目是否也支持?
阿里云的文字识别(OCR)服务在教育场景中的应用,包括试卷切题识别,主要是针对图片或者扫描件进行识别的。对于Word文档的形式,理论上可以通过转换为图片或者扫描件后进行识别。
目前暂不支持批量导入,我们有教育场景的识别能力 可以在这里测试一下:
https://duguang.aliyun.com/experience?type=edu 。只能单张识别。目前支持上传的文件格式.png / .jpg / .jpeg / .jpe / .bmp / .gif / .tiff / .tif / .webp。word文档暂不支持哈。此回答来自钉群【官方】阿里云OCR公共云客户交流群。
文字识别OCR工具支持对多种格式的文件进行识别,包括Word文档在内的大多数常见文件格式都是可以被支持的。一般来说,在教育场景下识别Word文档里的题目时,您可以将整个Word文档上传到识别工具,并进行批量处理。
但是请注意,OCR工具并不一定能够完美识别Word文档中的所有元素,例如公式和特殊字符等等,因为这些元素可能比较复杂并且需要特殊的算法才能够正确识别。而且,OCR工具也不一定能正确识别图像或图表等非文字类元素。对于这种情况,您可能需要手动调整输出结果或者寻找其他解决方案。
至于批量导入是否支持切题识别,则要看您所使用的具体工具和它的配置情况。一般来说,OCR工具应该能够支持切题识别,并且可以在较短时间内完成整个过程
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。