文档备案控制台

开发者社区视觉智能文字识别正文

OCR这个代码里面没有输入的图片路径之类的吗？如何加请求参数？

OCR这个代码里面没有输入的图片路径之类的吗？如何加请求参数？

展开

收起

真的很搞笑 2023-04-19 07:56:44 333 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com
是的，以上代码中并没有提供输入的图片路径，因为该代码的示例采用的是阿里云 OCR 的图像 URL 地址进行识别的方式。

如果您需要使用本地的图片文件，可以使用 python 的 open 函数读取本地图片文件，然后将读取到的二进制数据作为 Image 参数传递给 API 接口。代码示例如下：
```
with open('/path/to/your/image.jpg', 'rb') as image_file:
    encoded_image = base64.b64encode(image_file.read())
params['ImageURL'] = ''
params['ImageUrl'] = ''
data = {
    'ImageType': 'Base64',
    'Image': encoded_image,
    'Url': '',
    'Height': '',
    'Width': '',
}
```
这里，我们将 params['ImageURL'] 和 params['ImageUrl'] 设置为空，以使用 Image 参数进行识别。然后读取 /path/to/your/image.jpg 文件的二进制数据，编码为 Base64 字符串，并将其作为 Image 参数传递给 API 接口。

如果您需要传递其他的请求参数，可以添加到 params 参数中，例如：
```
params['OCRType'] = 'normal'
params['OutputFileFormat'] = 'normal'
params['MinHeight'] = ''
params['MaxHeight'] = ''
params['ReturnType'] = ''
params['ProjectId'] = ''
params['Side'] = ''
params['WatermarkImageURL'] = ''
params['Watermark'] = ''
```
其中，OCRType 是 OCR 识别类型，支持 normal（普通文本）、table（表格识别）、mixed（混合识别）；OutputFileFormat 是输出结果的格式，支持 normal（普通文本）、json（JSON 格式结果）、xml（XML 格式结果）；MinHeight 和 MaxHeight 是识别文本的高度限制，单位为像素；其他参数的详细说明请参考阿里云 OCR 官方文档。
2023-04-30 16:29:51

赞同展开评论
芯在这

// InputStream inputStream = new FileInputStream("D:\Image\题目识别\test1.jpg"); // recognizeAdvancedRequest.setBody(stream);，此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

2023-04-19 11:45:23

赞同展开评论

问答分类：

文字识别视觉智能开放平台

问答标签：

印刷文字识别代码印刷文字识别图片印刷文字识别类印刷文字识别请求参数印刷文字识别路径

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

文字识别OCR中typescript接入ocr ，把示例弄下来代码报错了。可以帮忙瞅瞅吗？

213

2

0

文字识别同样的图片为什么识别效果不同

260

1

0

OCR入参图片链接不支持 OSS 带有效时间的图片链接？

310

2

0

文字识别OCR type 传 Advanced 是能识别图片的，但是传这个参数就不行，咋整？

299

2

0

文字识别OCR什么时候能支持这类发票？

295

2

0

文字识别OCR比如我截图一张excel图片，目的是想把识别到同一行的内容当作一行来输出可以吗？

201

2

0

在文字识别OCR中，请问发票核验的请求参数中的verifycode机器验证码是怎么填写的?

211

1

0

文字识别OCR如何传本地图片？

329

1

0

在文字识别OCR中，参考代码没有二进制文件方式的示例？

177

1

0

在文字识别OCR中当请求参数的字段为 body 的时候，还是 GET请求吗？

180

1

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

YOLO26如何涨点系列篇（NEU-DET缺陷检测） | CVPR2026 FAAFusion 解决Neck跨尺度方向冲突，实现涨点1.2%

"多路全景视频实时拼接融合"边缘计算网关几种拼接方式

Rokid AI 眼镜远程协作应用"一线互联"开发实践：设备发现与 BLE 扫描

一线互联 × Rokid AI眼镜：为什么它是工业4.0时代一线人员的标准装备？

Ж-CEH：锚定结构存在论—— 从宇宙虚无到视觉张量的统一框架

热门讨论

热门文章

身份证识别ocr，每次购买需要更换url地址吗？

你好，我想问下，python调用接口，Sample.main() 函数，会return 文字识别的结

文字识别ocr支持android吗，android sdk文档链接有不？

文字识别OCR体验了一下，识别不出来，麻烦帮我看下怎么解决？

为什么我们这边的文字识别OCR现在出现了发票类型识别不稳定的情况？

OCR中java 代码示例，返回这个是什么意思？

文字识别OCR API有没有Delphi的demo哦？

文字识别OCR目前有哪些情况会导致识别失败？

目前OCR中如果部署在本地的话，识别速度怎么样？一张图片平均多久可以识别到

请问文字识别OCR的TaskId这个参数是什么意思？不是只要唯一就可以吗？

展开全部

图像文字识别(OCR)用什么算法小结

浪潮发布业界最高GPU密度的SR-AI整机柜

使用图像文字识别技术获取失信黑名单

视觉智能开放平台【文字识别】类目新增五个AI算法，快来看看吧~

阿里云视觉智能开放平台--文字识别使用教程

OCR文字识别技术总结（一）

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

分析对比大模型OCR、传统OCR和深度学习OCR

【繁体图片文字识别】竖排的繁体图片文字识别翻译，竖排的繁体图片文字如何识别，竖排繁体图片识别后转横排，竖排的繁体识别比较友好的方法

展开全部

还有其他疑问?