modelscope-funasr在windows部署是按照这个步骤就可以了吗？

modelscope-funasr把读光OCR-多场景文字识别在windows部署是按照这个步骤就可以了吗？

展开

收起

真的很搞笑 2024-02-08 12:15:22 540 版权

阿里云 AI 助理回答

根据您提供的问题，关于在 Windows 系统上部署 读光OCR-多场景文字识别 的步骤，可以参考以下内容进行操作。以下是详细的部署流程和注意事项：

1. 获取接口服务代码

首先，您需要前往阿里云的 OpenAPI门户，找到对应的 文字识别OCR接口服务。完成测试后，下载完整的工程代码。
- 操作步骤： 1. 登录阿里云控制台。 2. 进入 OpenAPI门户，搜索并选择 文字识别OCR 相关接口。 3. 在线测试接口功能，确保其符合需求。 4. 测试完成后，下载完整工程代码。

2. 修改代码参数

下载的工程代码需要根据您的实际需求进行参数配置。
- 关键操作： 1. 修改代码中的 API 密钥（AccessKey ID 和 AccessKey Secret）。 2. 配置服务器地址、端口等运行环境参数。 3. 根据业务需求调整 OCR 接口调用参数，例如图片格式、识别字段等。

3. 打包并部署到 Windows 服务器

将修改后的代码打包，并部署到您的 Windows 服务器上。
- 具体步骤： 1. 使用工具（如 PyInstaller 或其他打包工具）将代码打包为可执行文件或服务。 2. 将打包后的文件上传至 Windows 服务器。 3. 在服务器上安装必要的依赖环境（如 Python、相关库等）。 4. 启动服务，确保 OCR 接口能够正常运行。

4. 模型训练与优化（如需自定义模型）

如果您需要使用自定义模型（如表格信息抽取、单据票证信息抽取等），则需要进行模型训练与优化。
- 训练建议： 1. 数据准备： 数据质量尽可能清晰端正，标注框需贴合字段文字。 2. 数据量要求： 数据量越大，模型效果越好。一般建议数据量达到 100+ 份（部分场景建议 200+ 份）。 3. 字段类型配置： 根据业务需求调整字段类型或高级选项，以提高识别精准度。 4. 版式分布： 训练数据应覆盖真实业务场景中的版式分布。

模型评估指标：
- 整体准确率： 测试集中被正确识别的字段占所有字段的比例。
- 单字段准确率： 测试集中该字段中被正确识别的数目占总比例。
- F1值： 综合评价指标，用于衡量检测模型的好坏。

5. 模型部署

模型训练完成后，进入 模型中心-模型详情 页面，点击 去部署 按钮，开始模型部署。
- 部署说明： 1. 部署过程需要一定时间，请耐心等待。 2. 部署成功后，可通过 在线体验界面 测试模型效果，或直接使用 API 进行在线服务调用。

6. 重要提示

商业化计费： 自 2023 年 8 月 23 日起，OCR 文档自学习功能已全面商业化。模型训练按 时长计费，模型推理调用按 调用量计费。
图片格式与尺寸限制：
- 支持格式：PNG、JPG、JPEG、BMP、GIF、TIFF、WebP（暂不支持 PDF）。
- 图片尺寸：长宽需大于 15 像素，小于 8192 像素；长宽比需小于 50。
- 图片大小：二进制文件不超过 10MB，URL 长度不超过 2048。
性能优化：
- 图片内单字大小建议保持在 10-50px 内，以获得较好的识别效果。
- 图片过大会影响接口响应速度，建议使用小于 1.5MB 的图片进行识别。