有人可以告诉我这段R代码是干什么的吗？

-5

set.seed(1234) 
dataPartition <- sample(2,nrow(data),replace=TRUE,prob=c(0.7,0.3))  
trainData <- data[dataPartition ==1,] 
testData <- [dataPartition ==2,]

来源

2017-04-19 Sharon Luk

为什么你不运行它并找出？ – EJoshuaS

它将您的数据分成两组。

 sample(2,nrow(data),replace=TRUE,prob=c(0.7,0.3))

您在由1和2组成的矩阵的长度中抽取一个向量，其概率为0.7和0.3。

 trainData <- data[dataPartition ==1,] 
     testData <- data[Partition ==2,] ## Fixed the brackets

这只是将您的数据分成两个，以便能够（我假设）验证模型。这里有一个更详细的答案，为什么将你的数据分为火车和测试 https://stats.stackexchange.com/questions/19048/what-is-the-difference-between-test-set-and-validation-set

来源

2017-04-19 13:22:30

有人可以告诉我这段R代码是干什么的吗？

回答

相关问题