数据集的文字标签(label)转成数字标签

简介: 数据集的文字标签(label)转成数字标签

但愿有人能明白我标题的意思,因为自己在找相关解决办法的时候这样搜没有找到,所以写这篇博客记录下。

问题:

我要放入模型中的训练集和标签是这样的(都是numpy格式的文件):

1ecd1b2606ed46e9956a89f231c9802c.png

2020062310470442.png

标签集中共有1926个标签,10个类别,(类别前边的数字,代表的是对应的第几张图片)。

然后,直接把他放进模型中训练,但是把标签数组转换成张量的过程中出现了类型不匹配问题

Ytr = np.load('train1/'+'Ytr01.npy',allow_pickle=True)
y_data = torch.from_numpy(Ytr).reshape(1926,).type(torch.FloatTensor)
Traceback (most recent call last):
  File "train.py", line 81, in <module>
    y_data = torch.from_numpy(Ytr).reshape(1926,).type(torch.FloatTensor) #
TypeError: can't convert np.ndarray of type numpy.object_. The only supported types are: float64, float32, float16, int64, int32, int16, int8, uint8, and bool.

那么,接下来就是解决TypeError: can't convert np.ndarray of type numpy.object_.


思路就是把原标签集中标签的类型改为上述错误中的任一基本类型,可以直接将标签集中的每个类别转换成一个整数。


这里要用到sklearn.preprocessing.LabelEncoder这个工具,文档写了多种转换方式,我根据自己的需要选择了其中一种:

import numpy as np
from sklearn.preprocessing import LabelEncoder
#先把原标签集加载进来
y = np.load('Desktop/UCF10/train1/'+'Ytr01.npy')
#转换
le = preprocessing.LabelEncoder()
y=le.fit_transform(y)
#保存新标签集
np.save("Desktop/UCF10/train1/Ytr01", y)

就是这点代码!顺便把测试标签也转了

看下效果:

1ecd1b2606ed46e9956a89f231c9802c.png

自动转好~~,具体解释看官放文档,用哪个理解哪个。官方

再放进模型中就可以正常跑了。。。

相关文章
|
7月前
|
存储 编解码 前端开发
Base64编码与打印标签(label)实例
在本篇文章,我们认识什么是Base64编码格式,以及它内部的编码规则;也列举了base64的常用使用场景以及注意方面,同时也列举了实际场景使用与代码示例。最后列举几种常用base64转码为arrayBuffer,blod等格式。
156 0
|
7月前
ArcGIS修改图层标签标注(Label)对应字段与内容的方法
ArcGIS修改图层标签标注(Label)对应字段与内容的方法
238 1
|
7月前
|
前端开发
HTML图片音频视频标签、超链接标签、列表标签和布局标签示例
HTML图片音频视频标签、超链接标签、列表标签和布局标签示例
91 0
HTML的基本知识(二)——段落标签、强制换行标签、水平线标签、图片标签
HTML的基本知识(二)——段落标签、强制换行标签、水平线标签、图片标签
|
存储 前端开发 API
标签(1)(详解)
标签(1)(详解)
textarea文本域控制字数多少(带数字,数字减小)demo效果示例(整理)
textarea文本域控制字数多少(带数字,数字减小)demo效果示例(整理)
|
开发框架 .NET
HTML 段落标签 文本显示标签
HTML 段落标签 文本显示标签
93 0
|
JSON 自然语言处理 JavaScript
字符串的解读和标签模板
字符串的解读和标签模板
102 0