rpart

    0热度

    1回答

    我最近一直在使用RPART并遇到了一个我不明白的计算。 在处理信息增益时,如何计算“改善”或变量重要性(它们似乎与我的测试相同)。 作为一个虚拟的例子,我试着学习下表: happy,class yes,p no,n 用命令: fit <-rpart(class ~ happy,data=train,parms = list(split="information"),mins

    0热度

    2回答

    我想用rpart和partykit构建一个分类决策树,并且我想知道这些包(或任何包,就此而言)中是否有任何函数允许我创建一个包含来自特定子树或分支的数据的数据集? 我知道我可以使用DT规则手动创建原始数据集的子集,但我试图自动执行某个过程,并发现该功能将对我有很大的帮助。 例子: library (rpart) library(partykit) data("Titanic", packag

    2热度

    1回答

    我正在尝试使用MLR软件包来调整使用rpart软件包构建的决策树的超参数。即使我可以调整决策树的基本参数(例如minsplit,maxdepth等),我也无法正确设置参数param的值。具体来说,我想在网格搜索中尝试不同的priors。 在这里,我写的代码(dat是我使用的数据帧,并target是我的类变量): # Create a task dat.task = makeClassifTask

    0热度

    1回答

    我有一些问题需要了解一些基础知识,所以我被卡住了回归树。 我使用rpart的分类树来检查环境参数对我测量的树木生长因子的影响。 长话短说: 将数据分解为训练和测试数据以及(何时)需要它的目的是什么?我的搜索显示了他们不做或不做的例子,但我找不到背景故事。这只是为了验证修剪吗? 谢谢!

    0热度

    1回答

    这是一般的虹膜建模代码和结果: This is the general iris modeling code and result: > library(party) > library(rpart) > library(tree) > library(caret) > train = sample(1:nrow(iris),nrow(iris)

    0热度

    1回答

    我是一个新的R用户,我的最终目标是使用prp。我已经使用下面的代码来安装rpart.plot。我需要对我的代码进行哪些更改才能使用prp? install.packages("rpart.plot", lib = "C:\\Users\\Desktop\\rpart.plot_2.1.2") ?prp output: No documentation for ‘prp’ in specifi

    0热度

    1回答

    我试图绘制使用rpart包,其输出中真的很困惑决策树一个不寻常的决定树输出(多类)。值得注意的是,在第三节点,农业和采矿班怎么能从城市生产? 我觉得应该是农业和城市,而不是农业和采矿业。 这里是我的代码 df<-read.csv("https://raw.githubusercontent.com/tuyenhavan/Statistics/Dataset/Landsat_Data.csv")

    0热度

    1回答

    我得到这个从模型: 在所述原始数据集,所述familygroup是分类变量,我必须根据不同的基团它重新编码成1至5。现在结果显示1.5?这是否意味着组1和组5的观察结果?如果是,是否意味着该组不等于组1,而5是否转向右边节点(< 1.5)?或者节点纯粹是一个1.5的数值? 我有几个节点有这些类型的结果。 这是我使用的脚本: printcp(模型)#显示结果 rpart.plot(型号,类型= 3,

    1热度

    1回答

    我正在使用mlr和其他软件包进行生存分析。在mlr中,我使用了surv.rpart和surv.glmboost。我也使用原始软件包rpart和mboost来做到这一点。我发现他们的结果是不同的。请看看下面的例子: > myData2 <- data.frame(DaySum=c(3,2,1,6,3,2,2,5,2,7,2), DaysDiff=c(24,4,5,12,3,31,

    0热度

    1回答

    我正在尝试在train中使用method = "glm"建立分类模型。 当我使用method = "rpart"它工作正常,但是当我切换到method = "glm"然后它给了我一个错误说 调谐参数电网应该有列参数 我尝试使用 cpGrid = data.frame(.0001) 也 cpGrid = data.frame(expand.grid(.cp = seq(.0001, .09, .