2013-05-07 102 views
0

我想根据几个变量来制作分类树来预测1种鸟类的存在与否。我知道rpart处理单变量分区,mvpart处理多变量分区,但是我想使用mvpart作为我的单变量树,因为它的输出更加灵活。有谁知道我不应该这样做的原因?分歧与mvpart在相同确切的输入上会有所不同吗?mvpart vs rpart中的分割规则

回答

2

不能保证分割是相同的; mvpart()正在最小化组内的平方和,而分类树的rpart将最小化基尼系数(默认IIRC)。

您可能会得到相同的模型/分割,但由于这两个函数使用两种不同的节点杂质度量,这可能只是一种侥幸。

仅供参考,mvpart正在拟合回归模型,但您需要分类模型。

最后,考虑使用聚会包及其功能ctree;它比默认的rpart有更好的输出,但同样在模型拟合方面略有不同。另外,还可以查看plotmo包,其中包括对许多树状模型(包括IIRC,rpart)的增强图。