categorical-data

2热度

1回答

有时，当将具有分类列的数据帧拆分为测试和训练集时，训练集将不包含分类变量的所有级别。当你再训练模型，并试图预测测试集，预测将失败：例如： x <- data.frame(...) # data frame with columns with very dispersed categorical variables set.seed(123) smp_size <- floor(0.75 *

0热度

1回答

Scikit学习：预测分类特征

0热度

4回答

如何重塑和总结从长到宽的分类数据？

我的数据库是像这样的： db <- data.frame(var1 = c("A", "B", "C", "D", "E"), var2 = c("X", "X", "Y", "Y", "Y"), var3 = c("G", "H", "G", "G", "K")) db var1 var2 var3 A X G B X H C Y G

0热度

1回答

如何生成分类响应的MATLAB条形图？

我有一个646x108阵列的646个学生对108个考题的回答。这是一个MCQ考试，所有答案都是A，B，C或D，所以这些字母是单元格数组的内容。我已经指示创建一个类似于下面的一个图：我被告知，“酒吧”功能会工作。但是，它不适用于单元阵列。我试着将它改为double的数组，其中A被转换为1，B转换为2，C转换为3，D转换为4.但是，这仍然不起作用。这似乎不是将回答视为明确，而是将回答平均化。当我

0热度

1回答

确定分类变量缺失的性质

您能否给我一些提示以找出分类变量缺失值缺失的性质？我的意思是，我对Google学者进行了快速搜索，但没有发现与此相关的任何内容。我怎么能理解，如果缺失值是完全随机缺失的，他们是随机丢失还是最终缺失，而不是随机丢失？除了研究域名，我什么也想不出来。感谢一些论文链接，提前致谢。（我会将它添加到sas环境中，但问题与此语言没有特别的关系）。

2热度

1回答

SPSS版本22：连接两列或更多列

我有两列称为column_a1和column_a2。两个分类（1：是，0：否）。我想连接两列并创建一个名为column_a的新列。即column_a包含来自column_a1和column_a2的数据。请协助。

0热度

1回答

颜色直方图与R中

分类变量填充我试图创建一个情节是这样的： qplot(carat, data = diamonds, geom = "histogram", fill = color) 然而，代替具有用于x轴的定量变量，我使用的分类数据。我使用的数据帧是这样的： refBases=c("A","A","A","C","C","C","G","G","G","T","T","T") altBases=c("C

3热度

1回答

自动使用LRT来评估整个因子变量的显着性

对于包含一个或多个因子变量的多变量回归模型，R的输出不会自动包含模型中整个因子变量显着性的似然比检验（LRT）。例如： fake = data.frame(x1=rnorm(100), x2=sample(LETTERS[1:4], size=100, replace=TRUE), y=rnorm(100)) head(fake) x1 x2 y 1 0.615

2热度

1回答

自动比较鼠标glm.mids中的嵌套模型

我有一个来自R的mice包的乘法 - 估算模型，其中有很多因子变量。例如： library(mice) library(Hmisc) # turn all the variables into factors fake = nhanes fake$age = as.factor(nhanes$age) fake$bmi = cut2(nhanes$bmi, g=3) fake$chl

1热度

2回答

通过组合R中的2个分类变量创建新变量

mydata$gender <- c("M", "F", "M") mydata$country <- c("USA", "USA", "USA") 通过组合性别和国家创建新变量。变量将声明“M USA”。所以我想不出如何结合这两个分类数据来产生我想要的。我认为重新编码它们需要很长时间。有没有办法做到这一点，而不使用交互功能？在此先感谢。