文档备案控制台

开发者社区问答正文

文档智能想要取图片中，红色截图位置的数据，怎样实现比较好？

文档智能想要取图片中，红色截图位置的数据，怎样实现比较好？

展开

收起

真的很搞笑 2023-04-11 13:35:25 193 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

为了从图片中智能提取特定位置（如红色截图所示）的数据，您可以按照以下步骤操作：

1. 数据准备

上传图片：首先，将包含目标数据的图片上传至阿里云的“数据中心-数据集”中。确保图片格式为jpg、jpeg或png，且文件大小不超过10M，单边长度不超过8192像素，长宽比不超过50:1。
创建数据集：在数据集中编辑名称并上传图片，至少准备50-60份同类任务的数据以优化模型训练效果。

2. 数据标注

创建标注任务：进入“数据中心-标注任务”，点击“创建标注任务”。命名任务后，选择或上传需要标注的数据集。
使用框选工具：针对红色截图区域，利用标注工具中的“框选”功能精确框选出待识别字段。对于文字倾斜的情况，可尝试使用“五角框”进行更贴合的框选。
配置字段信息：在题目设置中，为框选出的字段填写正确的字段名称和类型，这有助于提高识别精度。
跨行标注处理：如果数据跨行，需分别框选对应部分，并通过按住“shift键”合并这些框选，确保所有相关数据被正确标注为一个整体。

3. OCR预标注与核对

开启OCR预标注功能，系统会自动识别框内文字内容，但务必仔细核对检查，尤其是手写体不被支持的情况下。

4. 质检与提交

完成标注后，进入质检环节，仔细检查标注的准确性，必要时进行修改或驳回重新标注。
确认无误后，提交标注任务，以便后续用于模型训练。

注意事项

图像质量：确保图片清晰，无遮挡，字迹端正，以提升识别准确率。
模型训练：若文档样式复杂或有特殊需求，可能需要更多样本和定制化训练来优化模型效果。
表格数据：若红色截图位置属于表格的一部分，应根据表格结构选择合适的标注方式（KV型或列表型），并正确创建表格模板。

通过上述流程，您可以有效地从图片中提取指定位置的数据，并通过不断优化标注和模型训练，提升数据抽取的准确性和效率。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答标签：

文档智能图片文档智能数据

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

文档智能接口可以识别图片、PDF、Excel、Word的内容，然后自动分析内容吗？

355

2

0

在文档智能中除了把文本按层级关系解析出来，像这种图片现在能支持也按层级解析出来吗？

107

1

0

文档智能 api文档里有word，测试页面只能是图片类或pdf，这个接口到底是否支持word文件？

166

1

0

文档智能可以知道这个图片是怎么识别的吗？

144

0

0

文档智能语雀文档里面的图片可以访问吗？

126

1

0

文档智能图片是只能读取 oss 的图片吗？

58

1

0

文档智能pdf 文件里图片中文字能提取到吗？

123

1

0

Doc2Bot数据集中，一个文档对话数据示例包含哪些部分？

97

1

0

在Doc2Bot数据集中，对话状态信息对文档对话系统有何影响？

92

1

0

在文档智能中图片信息是指什么呢，比如这张图，他会用一段话描述，比如高楼大厦，之类的吗？

110

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

阿里云如何部署使用OpenClaw？OpenClaw部署一看就会：零基础零代码、纯点击

阿里云ECS 手动部署 OpenClaw 超详细教程（2026最新版）

2026年阿里云新老用户如何部署OpenClaw？OpenClaw部署喂饭级教程

2026年新用户购买阿里云服务器多少钱1年？阿里云新用户有什么优惠？

在今天3点左右通义灵码问问题不正常返回了

相关解决方案

更多

基于数据闪回，快速恢复数据

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

数据守护：防勒索攻击数据保障

高效存储和处理多媒体数据

还有其他疑问?