2015-02-24 90 views
0

我在R中还是比较新的,我有一个可能很容易的问题,我希望你能回答。分层抽样

我工作的数据集:GSS 2010。我有一个每个答辩人的ID,我有9个数字级别的变量'区域'。在所有2044个794个变量的观察中。

我想绘制一个大小为100的样本,每个分层的样本都与其人口规模(完整的GSS)成比例。

我已经看过包中的“采样”和“调查”,但不幸的是我还没有能够画出样本。

到目前为止,我最好的猜测是这样的:

#Stratified subsample of GSS2010; regions as strata 
s=strata(GSS2010,c("region"),size=c(100), method="systematic", pik=id$region) 

我希望你能帮助。非常感谢你提前。

最佳, 苏菲

+0

您可以查看我的“splitstackshape”包中的“stratified”函数或“dplyr”中的'sample_frac'。你的问题现在还不够清楚。 – A5C1D2H2I1M1N2O1R2T1 2015-03-07 15:08:43

回答

0

我觉得 样品 功能的基础R应该足够:

s <- GSS2010[sample(dim(GSS2010)[1]),] 

这将选择百行中的数据帧。每个区域被选中的概率将与数据帧中该区域的行数成正比。

如果这不是你想请编辑的一句话

什么“与比例采样,其人口规模(全部GSS)各阶层。”

为了更清楚。