2
我明白,要选择一个随机抽样选择随机样本,我可以用SAS从数据集
proc surveyselect data = raw_data method = srs n=200000 out=sample_data;
run;
但是,有时我raw_data有记录< 200000如果raw_data小,我就数喜欢只保留raw_data;如果它超过一百万条记录,我想随机选择一条200k条记录。我应该怎么做?
谢谢!
RTM:你会发现选项全选 –
@data_null_我认为OP希望[N <的1000000:nsamp =全部] [N>的1000000:NSAM = 200000],因此它比全选稍微复杂一些。 – Joe