rpart

    2热度

    2回答

    我想通过使用“caret”包的列车功能进行交叉验证来建立CART模型。 我的数据是4500 x 110数据框,其中所有的预测变量(除了前两个UserId和YOB(Year of Birth),我没有用于模型构建)除了因变量这是整数类型(虽然只有两个值1和0)。性别是自变量之一。 当我运行rpart命令获取CART模型(使用软件包“rpart”)时,我对预测函数没有任何问题。不过,我想提高通过交叉验

    1热度

    1回答

    我试图通过使用rpart fucntion来找到切点,我的响应变量是二进制的。当我使用anova方法时,它给出了一组分离,而当我使用类方法时,我什么也得不到。任何人都可以告诉我为什么是这样的,通过anova分离对于二元变量仍然是一个好的切入点? 谢谢。

    0热度

    1回答

    RPART对连续,序数和分类变量使用不同的分割过程。有没有办法“通知”RPART变量类型?为了说明,我有一个有整数值的有序变量(1,...,5)。现在,我需要将它强制转换成角色,这样RPART不会像连续变量那样分裂它。 我想不要改变我所有的变量类型,只是为了RPART。不管怎样,我宁愿宣布它。 谢谢。

    4热度

    2回答

    我正在使用rpart包进行决策树分类。我有一个具有4000个功能(列)的数据框。我想为我的模型使用rpart()中的所有功能。我怎样才能做到这一点?基本上,rpart()会问我使用的功能是这样的: dt <- rpart(class ~ feature1 + feature2 + ....) 我的特点是在文档中的词,所以我有超过4K的功能。每个功能都由一个词表示。有没有可能在不写信的情况下使用

    4热度

    2回答

    我有一个具有14个特征的数据集,其中很少有如下所示,其中性别和婚姻状况是分类变量。 height,sex,maritalStatus,age,edu,homeType SEX 1. Male 2. Female MARITAL STATUS 1. Married 2. Living together, not married 3.

    0热度

    1回答

    使用rpart创建我的CART后,我继续使用partykit包中的as.party函数将其转换为party对象。出现subsecuent错误: as.party(tree.hunterpb1) Error in partysplit(varid = which(rownames(obj$split)[j] == names(mf)), : ‘index’ has less than two el

    -1热度

    1回答

    中获取错误“可变长度不同(找到'columns_features')”我将rpart函数应用于一个名为train的数据框,其中包含所有整数值。 功能太多,所以我创建了一个公式。 columns_features <- (paste(colnames(train)[31:50], collapse = "+")) formulas <- as.formula(train$left_eye_cent

    1热度

    1回答

    数据集可以从http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/ 下载得到以下错误使用rpart包功能时: formula(formula, data = data) : invalid model formula in ExtractVars 使用以下代码: install.packages("

    2热度

    1回答

    我使用rpart.plot包中的prp函数来绘制一棵树。对于状态这样的分类数据,它给出了一个非常长的变量列表,并且使其不易读。如果超过一定长度,是否有任何方法将文本包装为两行或更多行?

    1热度

    1回答

    有人知道什么水平线上的那手段意味着我得到了在R上的解释: minline:whether a horizontal line is drawn 1SE above the minimum of the curve. 什么1SE?