大佬们请教下有没有识别率高的ocr工具 ,可以识别word,表格pdf和图片?
在ModelScope中,有多个OCR模型供你选择和使用。这些模型包括文字检测、印刷文字识别、手写文字识别、有线表格识别和无线表格识别等。其中,文字检测多模态预训练模型DB是由读光OCR团队开发并集成在ModelScope上,为用户提供了便捷的调用示例。此外,阿里云上也提供了可以免费或付费使用的OCR接口。
你可以利用这些工具搭建票据解析助手、证件核验助手以及表格信息统计助手等实用型工具,也可以根据自己的需求DIY一个类似DocMaster的文档精准文档机器人。
在ModelScope中,存在一些具有高识别率的OCR工具。例如,文字识别模型适用于单行文字检测,同时也可用于识别通用场景、手写体场景、web场景和日常场景的文字。此外,对于复杂的文档图文信息,比如包含表格的图片或PDF文件,可以尝试使用DocMaster。这个工具基于精准且种类丰富的OCR API或者模型,能够读取理解并响应复杂的文档图文信息。
特别地,如果你需要处理的是手写文档或者表格,你可以尝试使用手写识别模型和DIY表格OCR。这些模型在处理这类特殊类型的文档时,可以提供更高的准确率。