文档备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ocr识别的label_dict.txt编码为utf8，windows下默认以gbk读取，导致报错

在运行时，使用ocr识别的模型damo/cv_convnextTiny_ocr-recognition-general_damo，其读取的字典文件label_dict.txt的编码为utf-8，但是在windows下默认以gbk读取，导致报错，无法进行后续推理。请问官方能否将modelscope库中以下代码 with open(label_path, 'r') as f:
修改为例如： with open(label_path, 'r', encoding='utf8') as f: 的方式，明确指定以utf-8方式读取，以便解决默认发布的模型库问题？

展开

收起

老唐250 2022-11-15 13:46:01 872 版权

2 条回答

写回答

取消提交回答

游客mahexp74d6pzw

通常情况下，OCR识别的label_dict.txt文件应该使用UTF-8编码，而不是GBK编码。如果您的Windows系统默认使用GBK编码来读取该文件，可能会导致读取错误。

解决这个问题的方法是，将Windows系统的默认编码设置为UTF-8，以便正确读取label_dict.txt文件。您可以按照以下步骤进行操作：

打开“控制面板”，并选择“时间、语言和区域”。选择“区域和语言”，然后在弹出的窗口中，选择“更改时区”按钮。在“区域和语言设置”窗口中，选择“中文（中华人民共和国）”下的“详细信息”按钮。在“语言区域”下，选择“英语（美国）”并单击“确定”。现在将文件关闭，然后将标签_dict.txt复制到一个文本编辑器中，并将其保存为UTF-8编码。再次打开Windows资源管理器，您应该能够正确读取该文件了。如果以上方法无法解决问题，您可以尝试使用文本编辑器（如记事本）打开label_dict.txt文件，并将其另存为UTF-8编码。

2023-05-23 16:18:09

赞同展开评论
ModelScope答疑志愿者

谢谢反馈。这个问题已经在代码层面修复，下个版本发布能带上，敬请期待

2022-11-16 10:07:38

赞同展开评论

相关问答

计算机视觉

文字识别OCR中typescript接入ocr ，把示例弄下来代码报错了。可以帮忙瞅瞅吗？

202

2

0

智能语音交互Windows上是否可以使用实时识别C++SDK3.0

192

1

0

文字识别报错unmatchedImageType

167

1

0

文字识别OCR报错:illegalCutType

210

1

0

宜搭连接器调用阿里云ocr报错

282

1

0

阿里云 ocr 识别身份证报错为什么

416

1

0

文字识别OCR这是啥意思？我在本地测试没啥问题，上线报错了。

174

1

0

文字识别OCR这个报错啥意思吧是服务过期了还是该氪金了？

324

2

0

阿里云OpenAPI客户安卓设备集成我们OCR的javasdk,运行时报错,帮忙看下什么原因？

169

1

0

文字识别OCR的24978模型在线体验报错如何解决？

195

0

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

收录在圈子:

计算机视觉

171

+ 订阅

相关文章

基于OCR的水位检测项目水位识别

商品采集服务设计：1688/淘宝链接自动抓取与解析

加密软件有哪些？透明加解密模式的企业数据安全防护实践

线上线下结合型社工攻击的技术链路与企业防御体系研究

精选 5 款基于 .NET 开源免费、功能强大的 Windows 系统优化工具

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

modelscope cache 环境变量是啥？

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope这个免费额度可以在哪里查询啊？

请问去哪里找ModelScope里面各个模型的id？

在ModelScope中，下载模型时的ssl问题怎么解决？!

ModelScope模型是咋收费的, 是按机器每小时收费嘛？

展开全部

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

Lumina-Image 2.0：上海 AI Lab 开源的统一图像生成模型，支持生成多分辨率、多风格的图像

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

极致的显存管理！6G显存运行混元Video模型

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

SkyReels-V1：短剧AI革命来了！昆仑开源视频生成AI秒出影视级短剧，比Sora更懂表演！

CogVideoX-Flash：智谱首个免费AI视频生成模型，支持文生视频、图生视频，分辨率最高可达4K

展开全部

还有其他疑问?