数据集的文字标签(label)转成数字标签

简介: 数据集的文字标签(label)转成数字标签

但愿有人能明白我标题的意思,因为自己在找相关解决办法的时候这样搜没有找到,所以写这篇博客记录下。

问题:

我要放入模型中的训练集和标签是这样的(都是numpy格式的文件):

1ecd1b2606ed46e9956a89f231c9802c.png

2020062310470442.png

标签集中共有1926个标签,10个类别,(类别前边的数字,代表的是对应的第几张图片)。

然后,直接把他放进模型中训练,但是把标签数组转换成张量的过程中出现了类型不匹配问题

Ytr = np.load('train1/'+'Ytr01.npy',allow_pickle=True)
y_data = torch.from_numpy(Ytr).reshape(1926,).type(torch.FloatTensor)
Traceback (most recent call last):
  File "train.py", line 81, in <module>
    y_data = torch.from_numpy(Ytr).reshape(1926,).type(torch.FloatTensor) #
TypeError: can't convert np.ndarray of type numpy.object_. The only supported types are: float64, float32, float16, int64, int32, int16, int8, uint8, and bool.

那么,接下来就是解决TypeError: can't convert np.ndarray of type numpy.object_.


思路就是把原标签集中标签的类型改为上述错误中的任一基本类型,可以直接将标签集中的每个类别转换成一个整数。


这里要用到sklearn.preprocessing.LabelEncoder这个工具,文档写了多种转换方式,我根据自己的需要选择了其中一种:

import numpy as np
from sklearn.preprocessing import LabelEncoder
#先把原标签集加载进来
y = np.load('Desktop/UCF10/train1/'+'Ytr01.npy')
#转换
le = preprocessing.LabelEncoder()
y=le.fit_transform(y)
#保存新标签集
np.save("Desktop/UCF10/train1/Ytr01", y)

就是这点代码!顺便把测试标签也转了

看下效果:

1ecd1b2606ed46e9956a89f231c9802c.png

自动转好~~,具体解释看官放文档,用哪个理解哪个。官方

再放进模型中就可以正常跑了。。。

相关文章
|
8月前
|
Kubernetes Perl 容器
k8s标签
k8s标签
|
5月前
|
索引
for标签
【8月更文挑战第6天】for标签。
40 4
|
6月前
|
Kubernetes 算法 调度
k8s 标签-2
k8s 标签-2
40 2
|
7月前
|
Python
if标签
【6月更文挑战第29天】if标签。
54 5
|
8月前
with标签
with标签
49 2
|
8月前
|
Python
for...in...标签
for...in...标签。
29 1
|
8月前
|
移动开发 HTML5
基本标签
基本标签
57 2
|
移动开发
常用的不常见标签
常用的不常见标签
62 1
HTML的基本知识(二)——段落标签、强制换行标签、水平线标签、图片标签
HTML的基本知识(二)——段落标签、强制换行标签、水平线标签、图片标签
|
移动开发 前端开发 JavaScript
HTML+CSS常用的标签总结
HTML+CSS常用的标签总结
130 0