from sklearn.preprocessing import LabelEncoder as LE, OneHotEncoder as OHE
import numpy as np
a = np.array([[0,1,100],[1,2,200],[2,3,400]])
oh = OHE(categorical_features=[0,1])
a = oh.fit_transform(a).toarray()
让我们假设第一列和第二列是分类数据。此代码执行一个热门编码,但对于回归问题,我想在编码分类数据后删除第一列。在这个例子中,有两个,我可以手动完成。但是如果你有很多明确的特征,你会如何解决这个问题呢?使用sklearn的OneHotEncoder去除色谱柱
是的,这会消除第一个分类集的第一列。但是如果我有1000个类别,并且我需要在一个热门编码之后删除每个第一列? – Makaroniiii
这个概念仍然是一样的,你可以像这样扩展到第三个维度:'a [:,:,1:]' –
再次抱歉,但是我收到这个错误:builtins.IndexError:数组索引太多 – Makaroniiii