2016-09-29 77 views
2

我试图在R中运行anova()并遇到一些困难。这是我迄今为止帮助解决我的问题所做的工作。按组拟合线性模型/方差分析

这里是我的数据到这一点的str()

str(mhw) 
'data.frame': 500 obs. of 5 variables: 
$ r : int 1 2 3 4 5 6 7 8 9 10 ... 
$ c : int 1 1 1 1 1 1 1 1 1 1 ... 
$ grain: num 3.63 4.07 4.51 3.9 3.63 3.16 3.18 3.42 3.97 3.4 ... 
$ straw: num 6.37 6.24 7.05 6.91 5.93 5.59 5.32 5.52 6.03 5.66 ... 
$ Quad : Factor w/ 4 levels "NE","NW","SE",..: 2 2 2 2 2 2 2 2 2 2 ... 

列r是表示一个数值,其行中的字段中的各个描绘驻留 c栏是表示数值的列的单个情节驻留
柱四对应于地理位置在现场其中每个小区驻留

Quad <- ifelse(mhw$c > 13 & mhw$r < 11, "NE",ifelse(mhw$c < 13 & mhw$r < 11,"NW", ifelse(mhw$c < 13 & mhw$r >= 11, "SW","SE"))) 
mhw <- cbind(mhw, Quad) 

我有适合lm()如下

nov.model <-lm(mhw$grain ~ mhw$straw) 
anova(nov.model) 

这是整个田间的anova(),它测试数据集中每个地块的谷物产量与秸秆产量。

我的麻烦是,我想运行一个单独的anova()我的数据的四列来测试每个象限的粮食产量和秸秆产量。

也许一个with()可能会解决这个问题。我以前从未使用过,现在正在学习R的过程中。任何帮助将不胜感激。

回答

5

我认为您R.

fit <- with(mhw, by(mhw, Quad, function (dat) lm(grain ~ straw, data = dat))) 

寻找by设施,因为你在Quad有4个级别,最终在fit 4个线性模型,即fit是“由”类对象长度的(一种类型的“列表”)4.

要获得系数为每个模型,您可以使用

sapply(fit, coef) 

要机生产线CE模型综上所述,使用

lapply(fit, summary) 

要导出方差分析表,使用

lapply(fit, anova) 

由于重复的例子,我拿着从?by的例子:

tmp <- with(warpbreaks, 
      by(warpbreaks, tension, 
       function(x) lm(breaks ~ wool, data = x))) 

class(tmp) 
# [1] "by" 

mode(tmp) 
# [1] "list" 

sapply(tmp, coef) 

#     L   M   H 
#(Intercept) 44.55556 24.000000 24.555556 
#woolB  -16.33333 4.777778 -5.777778 

lapply(tmp, anova) 

#$L 
#Analysis of Variance Table 
# 
#Response: breaks 
#   Df Sum Sq Mean Sq F value Pr(>F) 
#wool  1 1200.5 1200.50 5.6531 0.03023 * 
#Residuals 16 3397.8 212.36     
#--- 
#Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
# 
#$M 
#Analysis of Variance Table 
# 
#Response: breaks 
#   Df Sum Sq Mean Sq F value Pr(>F) 
#wool  1 102.72 102.722 1.2531 0.2795 
#Residuals 16 1311.56 81.972    
# 
#$H 
#Analysis of Variance Table 
# 
#Response: breaks 
#   Df Sum Sq Mean Sq F value Pr(>F) 
#wool  1 150.22 150.222 2.3205 0.1472 
#Residuals 16 1035.78 64.736 

我知道这个选项,但不是fa熟悉它。由于@Roland针对上述重复的例子,提供代码:

library(nlme) 
lapply(lmList(breaks ~ wool | tension, data = warpbreaks), anova) 

为您的数据,我认为这将是

fit <- lmList(grain ~ straw | Quad, data = mhw) 
lapply(fit, anova) 

你不需要安装nlme;它附带R作为推荐软件包之一。

+0

谢谢。这提供了数据的“系数”。如果我想产生完整的anova摘要来检验假设,“东部象限对西象限的谷物产量是否有差异”。我怎样才能用'fit'生产这个' – pc8807

+0

Worked Perfect。非常感谢你的帮助。我对这些问题的简单性表示歉意。正如我所说的,我正在学习R的过程中,稍微回过头来看看我的语法。 – pc8807

+0

该链接相当有帮助。这清除了我与R一起工作时出现的许多问题。 – pc8807