modelscope-funasr在windows部署是按照这个步骤就可以了吗?

modelscope-funasr把 读光OCR-多场景文字识别 在windows部署是按照这个步骤就可以了吗?image.png

展开
收起
真的很搞笑 2024-02-08 12:15:22 274 分享 版权
阿里云 AI 助理回答

根据您提供的问题,关于在 Windows 系统上部署 读光OCR-多场景文字识别 的步骤,可以参考以下内容进行操作。以下是详细的部署流程和注意事项:


1. 获取接口服务代码

首先,您需要前往阿里云的 OpenAPI门户,找到对应的 文字识别OCR接口服务。完成测试后,下载完整的工程代码。
- 操作步骤: 1. 登录阿里云控制台。 2. 进入 OpenAPI门户,搜索并选择 文字识别OCR 相关接口。 3. 在线测试接口功能,确保其符合需求。 4. 测试完成后,下载完整工程代码。


2. 修改代码参数

下载的工程代码需要根据您的实际需求进行参数配置。
- 关键操作: 1. 修改代码中的 API 密钥(AccessKey ID 和 AccessKey Secret)。 2. 配置服务器地址、端口等运行环境参数。 3. 根据业务需求调整 OCR 接口调用参数,例如图片格式、识别字段等。


3. 打包并部署到 Windows 服务器

将修改后的代码打包,并部署到您的 Windows 服务器上。
- 具体步骤: 1. 使用工具(如 PyInstaller 或其他打包工具)将代码打包为可执行文件或服务。 2. 将打包后的文件上传至 Windows 服务器。 3. 在服务器上安装必要的依赖环境(如 Python、相关库等)。 4. 启动服务,确保 OCR 接口能够正常运行。


4. 模型训练与优化(如需自定义模型)

如果您需要使用自定义模型(如表格信息抽取、单据票证信息抽取等),则需要进行模型训练与优化。
- 训练建议: 1. 数据准备: 数据质量尽可能清晰端正,标注框需贴合字段文字。 2. 数据量要求: 数据量越大,模型效果越好。一般建议数据量达到 100+ 份(部分场景建议 200+ 份)。 3. 字段类型配置: 根据业务需求调整字段类型或高级选项,以提高识别精准度。 4. 版式分布: 训练数据应覆盖真实业务场景中的版式分布。

  • 模型评估指标:
    • 整体准确率: 测试集中被正确识别的字段占所有字段的比例。
    • 单字段准确率: 测试集中该字段中被正确识别的数目占总比例。
    • F1值: 综合评价指标,用于衡量检测模型的好坏。

5. 模型部署

模型训练完成后,进入 模型中心-模型详情 页面,点击 去部署 按钮,开始模型部署。
- 部署说明: 1. 部署过程需要一定时间,请耐心等待。 2. 部署成功后,可通过 在线体验界面 测试模型效果,或直接使用 API 进行在线服务调用。


6. 重要提示

  • 商业化计费: 自 2023 年 8 月 23 日起,OCR 文档自学习功能已全面商业化。模型训练按 时长计费,模型推理调用按 调用量计费
  • 图片格式与尺寸限制:
    • 支持格式:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP(暂不支持 PDF)。
    • 图片尺寸:长宽需大于 15 像素,小于 8192 像素;长宽比需小于 50。
    • 图片大小:二进制文件不超过 10MB,URL 长度不超过 2048。
  • 性能优化:
    • 图片内单字大小建议保持在 10-50px 内,以获得较好的识别效果。
    • 图片过大会影响接口响应速度,建议使用小于 1.5MB 的图片进行识别。

总结

按照上述步骤,您可以顺利完成 读光OCR-多场景文字识别 在 Windows 系统上的部署。如果涉及自定义模型训练,请确保数据质量和版式分布符合业务需求,并注意商业化计费规则。

如有进一步疑问,请随时联系阿里云技术支持团队!

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理