0
我正在使用泰坦尼克号数据集。我试图在CABIN栏中填写空格。我从CABIN列值中提取了第一个字母,然后将它们放在CABIN_NEW列中。之后,我使用rpart
进行预测,但每次运行下面的代码时,R都需要很长时间(还没完成一次,每次都必须终止)。在R Studio中执行rpart
数据集有1309行,我正在使用的列在代码中。我使用的系统是在4 GB内存,i5处理器和Window 7
combifit <- rpart(Cabin_New ~ Pclass + Sex + Age + SibSp + Parch + Fare + Embarked + Title
+ FamilySize + Surname + FamilyID,
data = combi[!is.na(combi$Cabin_New),], method = 'class')