备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ocr识别的label_dict.txt编码为utf8，windows下默认以gbk读取，导致报错

在运行时，使用ocr识别的模型damo/cv_convnextTiny_ocr-recognition-general_damo，其读取的字典文件label_dict.txt的编码为utf-8，但是在windows下默认以gbk读取，导致报错，无法进行后续推理。请问官方能否将modelscope库中以下代码 with open(label_path, 'r') as f:
修改为例如： with open(label_path, 'r', encoding='utf8') as f: 的方式，明确指定以utf-8方式读取，以便解决默认发布的模型库问题？

展开

收起

老唐250 2022-11-15 13:46:01 769 版权

2 条回答

写回答

取消提交回答

游客mahexp74d6pzw

通常情况下，OCR识别的label_dict.txt文件应该使用UTF-8编码，而不是GBK编码。如果您的Windows系统默认使用GBK编码来读取该文件，可能会导致读取错误。

解决这个问题的方法是，将Windows系统的默认编码设置为UTF-8，以便正确读取label_dict.txt文件。您可以按照以下步骤进行操作：

打开“控制面板”，并选择“时间、语言和区域”。选择“区域和语言”，然后在弹出的窗口中，选择“更改时区”按钮。在“区域和语言设置”窗口中，选择“中文（中华人民共和国）”下的“详细信息”按钮。在“语言区域”下，选择“英语（美国）”并单击“确定”。现在将文件关闭，然后将标签_dict.txt复制到一个文本编辑器中，并将其保存为UTF-8编码。再次打开Windows资源管理器，您应该能够正确读取该文件了。如果以上方法无法解决问题，您可以尝试使用文本编辑器（如记事本）打开label_dict.txt文件，并将其另存为UTF-8编码。

2023-05-23 16:18:09

赞同展开评论
ModelScope答疑志愿者

谢谢反馈。这个问题已经在代码层面修复，下个版本发布能带上，敬请期待

2022-11-16 10:07:38

赞同展开评论

相关问答

计算机视觉

文字识别OCR中typescript接入ocr ，把示例弄下来代码报错了。可以帮忙瞅瞅吗？

126

2

0

智能语音交互Windows上是否可以使用实时识别C++SDK3.0

100

1

0

文字识别同样的图片为什么识别效果不同

126

1

0

文字识别报错unmatchedImageType

89

1

0

OCR识别报错检测不到我的包，是为什么？

148

1

0

宜搭连接器调用阿里云ocr报错

189

1

0

阿里云 ocr 识别身份证报错为什么

205

1

0

文字识别OCR标注中心这里进去报错了，怎么解决？

134

1

0

文字识别OCR报错463是什么原因？

91

2

0

文字识别OCR这是啥意思？我在本地测试没啥问题，上线报错了。

90

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

收录在圈子:

计算机视觉

171

+ 订阅

相关文章

安装Docker及其基本操作命令概览

dotnet-sdk-10.0.100-win-x64.exe 怎么安装？Win10/Win11 安装步骤教程

Burp Suite Professional 2025.11 发布，新增功能简介

Visual Studio 2026 正式版发布 - 适用于 Windows 上 .NET 和 C++ 开发人员的最全面 IDE

【Github热门项目】DeepSeek-OCR项目上线即突破7k+星！突破10倍无损压缩，重新定义文本-视觉信息处理

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

我希望通过damo-YOLO训练1500*1500的图片

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

com/action/joingroup?code=v1是什么意思

cpu部署报错 Torch not compiled with CUDA enabled

在ModelScope中，下载模型时的ssl问题怎么解决？!

在ModelScope中，请问模型下载到本地的具体方法？

ModelScope中，我的推理卡，v100，不支持fp16，我要怎么改？

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

展开全部

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

ColorFlow：腾讯和清华大学联合推出的图像序列着色模型，通过参考图像的颜色对黑白漫画进行着色生成彩色漫画

BEN2：一键快速抠图！自动移除图像和视频中的背景，支持在线使用

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

InvSR：开源图像超分辨率生成模型，提升分辨率，修复老旧照片为超清图像

PSHuman：开源单图像3D人像重建技术，一张照片就能生成3D人像模型

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

SPAR3D：一张图片就能生成3D模型，每个物体的重建时间仅需0.7秒！

Leffa：Meta AI 开源精确控制人物外观和姿势的图像生成框架，在生成穿着的同时保持人物特征

展开全部

还有其他疑问?