开发者社区 问答 正文

怎么文档智能图片转word转后一行一页?

怎么文档智能图片转word转后一行一页?
iQELAqNqcGcDAQTNAnMFzQJ3BtoAI4QBpCEFj44Cqr8PUKNyM1LyuSEDzwAAAYtMGdLUBM4ANUKZBwAIAAoE.jpg_720x720q90.jpg
iQELAqNwbmcDAQTNBFoFzQJ0BtoAI4QBpCEFj44CqpHsFO-uFXcWOlADzwAAAYtMGdZVBM4ANUKiBwAIAAoE.png_720x720q90.jpg

展开
收起
青城山下庄文杰 2023-10-23 15:07:41 51 分享 版权
阿里云 AI 助理回答

要实现文档智能中图片转Word后一行一页的效果,您需要按照以下步骤操作,并结合相关参数进行配置。以下是详细的流程和说明:


1. 调用图片转Word异步提交服务

图片转Word接口为异步接口,您需要先调用SubmitConvertImageToWordJob接口提交任务。

请求参数

  • ImageUrls(必填):图片的URL集合,最多支持30张图片,格式包括jpg、jpeg、png、bmp、gif(gif仅支持第一帧)。
    注意:不支持最长边超过8192px或大小超过20MB的图片。
  • ImageNames 或 ImageNameExtension(二选一):指定图片文件名或后缀名。
  • OssBucket 和 OssEndpoint(可选):如果您使用OSS托管服务,需提供个人的OSS Bucket名称和Endpoint地址。

示例代码

request = docmind_api20220711_models.SubmitConvertImageToWordJobRequest(
    image_urls=['https://example.com/example.jpg'],  # 图片URL
    image_name_extension='jpg'  # 图片格式
)
response = client.submit_convert_image_to_word_job(request)

2. 查询转换结果

提交任务后,您需要通过GetDocumentConvertResult接口轮询查询转换结果。

请求参数

  • Id(必填):从异步提交接口返回的业务订单号。

轮询建议

  • 建议每10秒轮询一次,最多轮询120分钟。如果120分钟内未查询到处理完成结果,则视为超时。
  • 转换结果在任务完成后24小时内可查询,超过24小时将无法获取。

示例代码

request = docmind_api20220711_models.GetDocumentConvertResultRequest(
    id='docmind-20220902-824b****'  # 异步任务返回的业务订单号
)
response = client.get_document_convert_result(request)

3. 配置一行一页效果

为了实现“一行一页”的效果,您需要对图片内容进行预处理或调整解析逻辑。以下是两种可能的解决方案:

方案一:图片预处理

在上传图片之前,您可以对图片内容进行分割,确保每张图片只包含一行文字。例如: - 使用图像处理工具(如OpenCV、PIL等)将原始图片按行分割成多张小图片。 - 将分割后的图片分别上传至SubmitConvertImageToWordJob接口。

方案二:调整解析逻辑

如果图片内容无法提前分割,您可以在解析后对生成的Word文档进行后处理: - 使用文档编辑工具(如Microsoft Word或Python的python-docx库)对生成的Word文档进行调整。 - 将每行文字单独放置在一个新页面中。


4. 注意事项

  • 图片格式限制:确保图片符合接口要求(最长边不超过8192px,大小不超过20MB)。
  • 免费额度:文档智能解析服务提供每月3000页的免费额度,超出部分将按量计费。
  • 超时处理:如果任务处理时间超过120分钟,请检查图片是否过大或过于复杂,必要时重新提交任务。

总结

通过上述步骤,您可以实现图片转Word后一行一页的效果。推荐优先对图片进行预处理,以减少后续调整的工作量。如有其他疑问,可参考文档智能的相关接口文档或联系技术支持团队。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答
问答标签:
问答地址: