0
我使用的是rpart
pacakge R
,我想为叶节点提取前2个预测类,而不仅仅是最好的。 以iris
数据为例:来自决策树的前n类叶节点
fit <- rpart(Species ~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)
print(fit)
,输出是:
n= 150
node), split, n, loss, yval, (yprob)
* denotes terminal node
1) root 150 100 setosa (0.33333333 0.33333333 0.33333333)
2) Petal.Length< 2.45 50 0 setosa (1.00000000 0.00000000 0.00000000) *
3) Petal.Length>=2.45 100 50 versicolor (0.00000000 0.50000000 0.50000000)
6) Petal.Width< 1.75 54 5 versicolor (0.00000000 0.90740741 0.09259259) *
7) Petal.Width>=1.75 46 1 virginica (0.00000000 0.02173913 0.97826087) *
我想知道每个叶节点,节点说7),什么是最好的第2种预测。默认情况下,它只打印出最好的预测种类virginica
更一般地,我想知道前n个预测类别。
是否可以从fit
中提取此信息而不更改rpart
的源代码?
它有帮助吗? –