备案控制台

开发者社区 > ModelScope模型即服务 > 多模态 > 正文

用OFA进行ocr训练任务

请问用OFA进行ocr训练任务时，如何安排图片、标签文件的层次结构，以及如何使用MsDataset.load语句将图片和对应的标签传递到train_dataset中呢？

展开

收起

OFA文字识别-中文-日常场景-base

游客tbkcs4rdokllm 2023-03-01 08:16:41 662 0

2 条回答

写回答

取消提交回答

7q53djewhjqbu

import os
import pandas as pd
import chardet
from PIL import Image
from datasets import Dataset
import tempfile
from modelscope.msdatasets import MsDataset
from modelscope.metainfo import Trainers
from modelscope.trainers import build_trainer
from modelscope.utils.constant import DownloadMode

with open('./ocr_labels_modelscope.csv', 'rb') as f:
result = chardet.detect(f.read())
data = pd.read_csv('./ocr_labels_modelscope.csv', encoding=result['encoding'])
ds = Dataset.from_pandas(data)
ds = MsDataset(ds)
print(next(iter(ds)))
文件格式：
image_id,text,image
000000000,硖,/mnt/workspace/images/000000000.jpg
000000001,饰,/mnt/workspace/images/000000001.jpg
000000002,晟,/mnt/workspace/images/000000002.jpg

2024-01-30 14:31:27

赞同展开评论打赏
游客vnqjw55ntakdm

同问，请问在文本行识别中如何使用MsDataset.load语句将图片和对应的标签传递到train_dataset中呢？

2023-03-23 18:57:51

赞同展开评论打赏

相关问答

文字识别OCR中，有办法训练将两行的内容合并成一块区域内容吗?

27

1

0

请问文字识别OCR模型训练失败在哪查看原因？

57

1

0

文字识别OCR模型训练环节，所使用的训练机，是否存在数据泄露的风险？

56

2

0

文字识别OCR长文档信息抽取这个应用类型上传20张图片训练可以上传不同模版的pdf吗？

21

1

0

文字识别OCR的表格信息抽取模型训练，开通后实际训练只用一分半钟，是要按19.739/小时扣费吗？

25

2

0

文字识别OCR中，这种透视表格中行和列也是动态列，进行表格信息抽取该如何训练标注？

28

2

0

文字识别ocr中读光OCR怎么训练本地数据呢，如果本地有图片和标注。这个例子跑不通是为什么？

66

2

0

文字识别OCR 一般情况下， 20-30个字段的KV模版训练，大约学习多少次能用？

27

2

0

有个问题咨询下，文字识别OCR文档自学习，训练数据用的是pdf，麻烦帮忙看下这个是什么原因？

12

0

0

使用ofa的ocr模型识别手写体文字时，怎么增加vocab.txt中没有的字

48

1

0

ModelScope模型即服务

多模态

包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域

我要提问

热门讨论

热门文章

18领域的文本分类模型在什么场景使用呢？

OFA文生图模型，显存空间不足的问题如何解决

docker和open-webui、ollama 部署本地的qwen2 14b 提供了API接口吗？

mPLUG图像描述模型-中文-base 如何finetune得到的？

中文StableDiffusion-通用领域，报错

modelscope版本1.2.1运行stable diffusion中文通用报错

StableDiffusion 报错，prompt_embeds

多模态热门的模型有哪一些？

请问Qwen-VL怎么用自己的数据集微调

mPLUG图像描述模型是什么？

展开全部

Vript：最为详细的视频文本数据集，每个视频片段平均超过140词标注｜多模态大模型，文生视频

请问有没有能撰写期刊学术论文的模型和数据？

中文竞技场大模型评测体验报告

展开全部

相关电子书

更多

阿里云智能-印刷文字识别OCR-产品介绍 立即下载

阿里巴巴读光OCR 立即下载

印刷文字识别算法设计与在线服务 立即下载

相关实验场景

更多