2012-07-24 40 views
0

我试图适应R.我有很大的血统和基因型数据广义线性混合模型系列ID。我尝试这样做:以指定用作GLMM或随机效应LME

m1 <- lmer(Final_sx~(1 | ID)+cohort2+cohort3+cohort4+sex, 
      data=solar_new_phen,family=poisson) 

它给我留言:

的随机效果的聚合因子的水平数是 等于为n,观测的数量

我在大多数教程中看到人们使用ID作为聚类变量。在亲情包,以及在lmekin功能是这样的:

rand.eff=formula(paste("~1|",sub.ID)) 
fit <- try(lmekin(fixed=fix.eff,data=x,random = rand.eff,varlist=list(kmat))) 

我应该使用单独的ID或家庭ID作为随机效应?我很困惑。我有家谱,我想我应该使用Family ID作为聚类变量。如果有人能够引导我对关于随机效应的小解释,那将是很棒的。

+0

[此问题](http://stats.stackexchange.com/q/18563/3601)在上交叉验证是相关的并可能有所帮助。 – Aaron 2012-07-24 18:49:41

+1

如果您想要为家庭估算单独的方差分量,那么您应该可以使用公式的随机效应部分的“家族ID”。如果您希望您的回答在家庭中相关,例如(可能会这样),这是有道理的。如果每个人都有多次观察,你可以(另外)包括一个可能与家庭水平随机效应相关的个体水平随机效应。它不会出现你做的。我会重新格式化你的问题,并问stats.stackexchange.com如果你的问题是更多的统计性质。 – lockedoff 2012-07-24 19:02:03

回答

1

因为你可能只有一行ID!为此,您需要许多obs为1 ID