当我们使用sklearn
进行fit
或者predict
等操作的时候,经常会遇到Expected 2D array, got 1D array instead一类的报错,其根本原因是因为最新的sklearn必须要传入一个二维矩阵所导致的,解决办法有如下三种。
一、numpy将行转成列
一行数据是一维数据,我们转成一列数据自然就是二维数据了。
import numpy as np x = [1, 2, 3] x = np.array(x).reshape(1, -1)
二、Pandas取一列数据问题
通常我们使用Pandas
取出DataFrame
中的一列数据时,也会出现此类报错,其原因是因为一列数据正常取出之后类型为Series
,这时我们需要换一种方式进行数据提取:
# 原提取方式示例,为Series data_train_x = data_train['age'] # 多加一个[]的提取结果为DataFrame data_train_x = data_train[['age']]
三、Pandas取一个数据问题
当我们进行单个数据提取并操作时,无论使用上述的那种办法都会出现错误,这时我们需要将单独的数据提取后再次转换为DataFrame
进行操作即可。
import pandas as pd # 使用pd.DataFrame进行操作 clf.predict(pd.DataFrame(data[['age']].iloc[2]))