2011-10-01 266 views
0

我已经将我的数据分成SAS中的5倍。所以,我有SAS中的交叉验证

S1,S2,S3,S4,S5

我想知道什么是通过每个褶皱的迭代进行交叉验证的最佳途径。例如,第一次迭代我想用s1作为测试集,s2,3,4,5作为训练集,第二次迭代用s2作为测试,s1,3,4,5作为训练等。

SAS中的什么样的循环可以实现这个目标?

谢谢!

+0

这取决于你所说的'交叉验证'。你能详细说明吗? – sasfrog

回答

2

可能最好是调用宏来使它更容易调用。

%Macro Validate(cur,i) ; 
%Do j = 1 %to 5 ; 

    %If &j <> &i %THEN 

    %DO; 

    Data &Cur._&j. ; 

    Set &cur S&j. ; 

    <validation steps> 

    Run; 

    %END; 

%End; 

%mend Validate ; 

Data _null_ ; 

Do i = 1 to 5 ; 

Call Execute("%Validate(s"||strip(i)||","||strip(i)||");"); 

End; 

Run; 
2

Proc gmlselect使用多种方法执行k次交叉验证以选择最佳模型。它是在9.1的实验,但在生产中发布9.2+

更多信息here

希望这有助于。