0
我尝试使用Python中随机森林,乘坐火车和测试数据集建立的预测模型是初学者。 train [“ALLOW/BLOCK”]可以取4个期望值中的一个(所有字符串)。测试[“ALLOW/BLOCK”]是需要预测的。如何在Python中使用factorize()之后获取原始值?
y,_ = pd.factorize(train["ALLOW/BLOCK"])
y
Out[293]: array([0, 1, 0, ..., 1, 0, 2], dtype=int64)
我用predict
进行预测。
clf.predict(test[features])
clf.predict(test[features])[0:10]
Out[294]: array([0, 0, 0, 0, 0, 2, 2, 0, 0, 0], dtype=int64)
我怎样才能得到原始值,而不是数字的?以下代码是否实际比较了实际值和预测值?
z,_= pd.factorize(test["AUDIT/BLOCK"])
z==clf.predict(test[features])
Out[296]: array([ True, False, False, ..., False, False, False], dtype=bool)
这工作,谢谢一吨!我不知道。 :) –