文档备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ocr识别的label_dict.txt编码为utf8，windows下默认以gbk读取，导致报错

在运行时，使用ocr识别的模型damo/cv_convnextTiny_ocr-recognition-general_damo，其读取的字典文件label_dict.txt的编码为utf-8，但是在windows下默认以gbk读取，导致报错，无法进行后续推理。请问官方能否将modelscope库中以下代码 with open(label_path, 'r') as f:
修改为例如： with open(label_path, 'r', encoding='utf8') as f: 的方式，明确指定以utf-8方式读取，以便解决默认发布的模型库问题？

展开

收起

老唐250 2022-11-15 13:46:01 895 版权

2 条回答

写回答

取消提交回答

游客mahexp74d6pzw

通常情况下，OCR识别的label_dict.txt文件应该使用UTF-8编码，而不是GBK编码。如果您的Windows系统默认使用GBK编码来读取该文件，可能会导致读取错误。

解决这个问题的方法是，将Windows系统的默认编码设置为UTF-8，以便正确读取label_dict.txt文件。您可以按照以下步骤进行操作：

打开“控制面板”，并选择“时间、语言和区域”。选择“区域和语言”，然后在弹出的窗口中，选择“更改时区”按钮。在“区域和语言设置”窗口中，选择“中文（中华人民共和国）”下的“详细信息”按钮。在“语言区域”下，选择“英语（美国）”并单击“确定”。现在将文件关闭，然后将标签_dict.txt复制到一个文本编辑器中，并将其保存为UTF-8编码。再次打开Windows资源管理器，您应该能够正确读取该文件了。如果以上方法无法解决问题，您可以尝试使用文本编辑器（如记事本）打开label_dict.txt文件，并将其另存为UTF-8编码。

2023-05-23 16:18:09

赞同展开评论
ModelScope答疑志愿者

谢谢反馈。这个问题已经在代码层面修复，下个版本发布能带上，敬请期待

2022-11-16 10:07:38

赞同展开评论

相关问答

计算机视觉

文字识别OCR中typescript接入ocr ，把示例弄下来代码报错了。可以帮忙瞅瞅吗？

237

2

0

智能语音交互Windows上是否可以使用实时识别C++SDK3.0

213

1

0

文字识别同样的图片为什么识别效果不同

277

1

0

OCR识别报错检测不到我的包，是为什么？

507

1

0

文字识别OCR标注中心这里进去报错了，怎么解决？

365

1

0

阿里云OpenAPI客户安卓设备集成我们OCR的javasdk,运行时报错,帮忙看下什么原因？

190

1

0

文字识别OCR识别报错，提示下载失败，怎么解决？

359

1

0

文字识别OCR模型ID:24711训练报错，怎么解决？

201

0

0

文字识别OCR报错463是什么原因？

202

2

0

文字识别OCR这个sdk 是不是不能在浏览器调用啊，解决了一堆报错，发现在报os 的错？

226

2

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

收录在圈子:

计算机视觉

171

+ 订阅

相关文章

阿里云OpenCode完整实操手册：Claude Code开源替代工具安装、模型接入全流程详解

Reasonix的使用方法

【AgentScope Java新手村系列】（19）多模态-图像音频视频

OpenClaw环境搭建常见报错解决，TopClaw部署工具自动修复功能

OpenClaw小白安装操作手册，TopClaw一键脚本及部署日志查看功能

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope镜像地址是什么？

ModelScope这个免费额度可以在哪里查询啊？

【DCT-Net人像卡通化】生成图像颜色诡异暗青色

请问Modelscope互联网如何访问Notebook的服务呢？

请问去哪里找ModelScope里面各个模型的id？

ModelScope在运行此API示例代码时出现错误请问时什么原因？

展开全部

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

AniDoc：蚂蚁集团开源 2D 动画上色 AI 模型，基于视频扩散模型自动将草图序列转换成彩色动画，保持动画的连贯性

LatentSync：根据音频生成高分辨率、动态逼真的唇形同步视频

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

SeedVR：高效视频修复模型，支持任意长度和分辨率，生成真实感细节

CogVideoX-Flash：智谱首个免费AI视频生成模型，支持文生视频、图生视频，分辨率最高可达4K

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

展开全部

还有其他疑问?