2016-08-19 86 views
0

我目前正在运行在R数据一GLM,我想,如果我使用的最好的模型,以了解。使用GLM与泊松或负二项计数资料

我的数据是随着时间的推移四种苍蝇,与种类,性别,密度和天存活率计数数据(我重复我的生存计,每5天)为不同的因素。

我的代码如下所示:

survival <- cbind(Dead,Alive) 
model1 <- glm (survival ~ Species*density*Sex*day, 
     data = DataM5, family = quasibinomial) 
car::Anova(model1, Type = "III") 
plot(model1) 

我的QQ地块有大尾巴,我残差VS拟合曲线看起来非常偏向右侧。我明白这是意味着我的变化不是正态分布(原谅我,如果我没有这个权利,我作战了解统计信息,但尽我所能),如果是这样的话,那么我的GLM的假设侵犯。从我读过的内容来看,我认为我需要使用泊松分布或负二项式分布,但是我似乎无法让它们中的任何一个工作。这是正确的方法吗?如果它是我如何得到它在R工作?

QQ Plot

Residual vs Fitted Plot

+0

这个问题似乎更多的统计数据除了R编程。因此我将其标记为被移交给交叉验证 –

回答

0
  1. 泊松回归与日志链接功能通常被用来模拟计数响应
  2. 密度性别*天,要包括所有协变量的相互作用,想想它是否真的有必要。通过使用这个模型,你可能会有一个模型来过滤数据。
  3. 泊松回归是GLM(一个或多个)中的一个,但残差不是assumped为正态分布。