categorical-data

    2热度

    1回答

    有时,当将具有分类列的数据帧拆分为测试和训练集时,训练集将不包含分类变量的所有级别。当你再训练模型,并试图预测测试集,预测将失败: 例如: x <- data.frame(...) # data frame with columns with very dispersed categorical variables set.seed(123) smp_size <- floor(0.75 *

    0热度

    1回答

    我想找出最好的一般方法来预测scikit-learn中的分类特征,并想要一些建议。特别是,我可以做一个决策树,它将处理分类数据就好,但我想尝试一些其他的多分类模型。我可以使用独特的方法将分类特征转化为大量的二元特征。 实例训练集: Age| Color | City | Freq 35 |'Orange'|'Seattle' | '<30' 55 |'Black' |'Portland'|

    0热度

    4回答

    我的数据库是像这样的: db <- data.frame(var1 = c("A", "B", "C", "D", "E"), var2 = c("X", "X", "Y", "Y", "Y"), var3 = c("G", "H", "G", "G", "K")) db var1 var2 var3 A X G B X H C Y G

    0热度

    1回答

    我有一个646x108阵列的646个学生对108个考题的回答。这是一个MCQ考试,所有答案都是A,B,C或D,所以这些字母是单元格数组的内容。我已经指示创建一个类似于下面的一个图: 我被告知,“酒吧”功能会工作。但是,它不适用于单元阵列。 我试着将它改为double的数组,其中A被转换为1,B转换为2,C转换为3,D转换为4.但是,这仍然不起作用。这似乎不是将回答视为明确,而是将回答平均化。 当我

    0热度

    1回答

    您能否给我一些提示以找出分类变量缺失值缺失的性质?我的意思是,我对Google学者进行了快速搜索,但没有发现与此相关的任何内容。我怎么能理解,如果缺失值是完全随机缺失的,他们是随机丢失还是最终缺失,而不是随机丢失?除了研究域名,我什么也想不出来。感谢一些论文链接,提前致谢。 (我会将它添加到sas环境中,但问题与此语言没有特别的关系)。

    2热度

    1回答

    我有两列称为column_a1和column_a2。两个分类(1:是,0:否)。我想连接两列并创建一个名为column_a的新列。即column_a包含来自column_a1和column_a2的数据。请协助。

    0热度

    1回答

    分类变量填充我试图创建一个情节是这样的: qplot(carat, data = diamonds, geom = "histogram", fill = color) 然而,代替具有用于x轴的定量变量,我使用的分类数据。我使用的数据帧是这样的: refBases=c("A","A","A","C","C","C","G","G","G","T","T","T") altBases=c("C

    3热度

    1回答

    对于包含一个或多个因子变量的多变量回归模型,R的输出不会自动包含模型中整个因子变量显着性的似然比检验(LRT)。例如: fake = data.frame(x1=rnorm(100), x2=sample(LETTERS[1:4], size=100, replace=TRUE), y=rnorm(100)) head(fake) x1 x2 y 1 0.615

    2热度

    1回答

    我有一个来自R的mice包的乘法 - 估算模型,其中有很多因子变量。例如: library(mice) library(Hmisc) # turn all the variables into factors fake = nhanes fake$age = as.factor(nhanes$age) fake$bmi = cut2(nhanes$bmi, g=3) fake$chl

    1热度

    2回答

    mydata$gender <- c("M", "F", "M") mydata$country <- c("USA", "USA", "USA") 通过组合性别和国家创建新变量。变量将声明“M USA”。 所以我想不出如何结合这两个分类数据来产生我想要的。 我认为重新编码它们需要很长时间。 有没有办法做到这一点,而不使用交互功能? 在此先感谢。