-5
set.seed(1234)
dataPartition <- sample(2,nrow(data),replace=TRUE,prob=c(0.7,0.3))
trainData <- data[dataPartition ==1,]
testData <- [dataPartition ==2,]
set.seed(1234)
dataPartition <- sample(2,nrow(data),replace=TRUE,prob=c(0.7,0.3))
trainData <- data[dataPartition ==1,]
testData <- [dataPartition ==2,]
它将您的数据分成两组。
sample(2,nrow(data),replace=TRUE,prob=c(0.7,0.3))
您在由1和2组成的矩阵的长度中抽取一个向量,其概率为0.7和0.3。
trainData <- data[dataPartition ==1,]
testData <- data[Partition ==2,] ## Fixed the brackets
这只是将您的数据分成两个,以便能够(我假设)验证模型。 这里有一个更详细的答案,为什么将你的数据分为火车和测试 https://stats.stackexchange.com/questions/19048/what-is-the-difference-between-test-set-and-validation-set
为什么你不运行它并找出? – EJoshuaS