2012-11-07 98 views
1

我想用R randomForest做一个多标签分类。 我有十个班A..J,R中的随机森林 - 很多类

我发现的例子如何预测一个类,如:

r = randomForest(J ~., data=train, importance=TRUE, do.trace=100) 

但我想预测更多的类,例如H,I,J。 (即说只有A..G被赋予属性)。 我该怎么办?

我有一个想法,保留A..G和只有一个预测类(H/I/J)和运行randomForest 3次,但也许有更好的方法?在一次运行中做到这一点?

非常感谢提前。

+1

你的问题可能会更清晰。你是否说你想要预测训练数据中不存在的课程?因为那会很困难。 – joran

+0

不,我的意思是我想把7列作为给定值,并预测其他3列的值。 – user1804773

+0

我不知道一个多元RF包的(可能是错误的,虽然...)。容易的事情是适合三个模型。 – joran

回答

1

假设所有属性H,I和J都是二元的。然后,你可以预测一个新的属性K的2^3个可能的值,然后将结果解码成3个属性:

  • 1 - > 0,0,0
  • 2 - > 0,0,1
  • 3 - > 0,1,0
  • 4 - > 0,1,1
  • 5 - > 1,0,0
  • 6 - > 1,0,1
  • 7 - > 1,1,0
  • 8 - > 1,1,1