看这段代码:PROC glmselect训练和测试
ods graphics on;
proc glmselect data=analysisData testdata=testData
seed=1 plots(stepAxis=number)=(criterionPanel ASEPlot);
partition fraction(validate=0.5);
class c1 c2 c3(order=data);
model y = c1|c2|c3|x1|x2|x3|x4|x5|x5|x6|x7|x8|x9|x10
|x11|x12|x13|x14|x15|x16|x17|x18|x19|x20 @2
/selection=stepwise(choose = validate
select = sl)
hierarchy=single stb;
run;
从here服用。我明白你明确地定义了训练(analysisData)和测试数据集(testData)。我不完全理解的是PARTITION语句。这是否意味着分析数据被分割为使用一半的分析数据用于训练,另一半用于“测试”又名验证,以确定例如候选模型的选定自变量如何执行?换句话说,testData从不用于训练,正如我所期望的那样。
PS:
顺便说一句,我怎么可以从80/20%分割一个originalDataset创建analysisData和TESTDATA?