OCR目前没有现成的接口直接返回PDF里的文字么?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
调用接口:http(s)://generalpdf.market.alicloudapi.com/ocrservice/pdf curl请求示例:
curl -i -k -X POST 'https://generalpdf.market.alicloudapi.com/ocrservice/pdf' -H 'Authorization:APPCODE 你自己的AppCode' --data '{
//文件数据:base64编码,要求base64编码后大小不超过100M,页数不超过20页,和url参数只能同时存在一个
"fileBase64": "",
//文件url地址:完整URL,URL长度不超过1024字节,URL对应的文件base64编码后大小不超过100M,页数不超过20页,和img参数只能同时存在一个
"url": "",
//是否需要识别结果中每一行的置信度,默认不需要。 true:需要 false:不需要
"prob": false,
//是否需要单字识别功能,默认不需要。 true:需要 false:不需要
"charInfo": false,
//是否需要自动旋转功能,默认不需要。 true:需要 false:不需要
"rotate": false,
//是否需要表格识别功能,默认不需要。 true:需要 false:不需要
"table": false,
//转文件类型,word
"fileType":"word"
}' -H 'Content-Type:application/json; charset=UTF-8'
//根据API的要求,定义相对应的Content-Type
https://market.aliyun.com/products/57124001/cmapi00043678.html#sku=yuncode3767800001——该回答整理自钉群“【官方】阿里云OCR公共云客户交流群”