我很难理解R因子anova的总结。 我不明白为什么我只有第一个变量才能得到2的Df。 A,B,C和D都有3个等级,所以在我的理解中,我应该得到2个Df和那些相互作用。 请帮我修复代码或了解结果。R因子Anova
P.S.我在哪里可以找到summary()的选项列表?我看到一个示例删除了sig level后的*,我想查看我拥有的选项。
预先感谢您
这里是数据我有完整的数据集我有
Runs I A B C D AB E AD BC F G H J K B1 B2 y
1 1 1 -1 -1 -1 -1 1 1 1 1 1 1 -1 -1 -1 -1 1 190.9
2 2 1 1 -1 -1 -1 -1 -1 -1 1 1 1 1 1 1 -1 -1 436.2
3 3 1 -1 1 -1 -1 -1 1 1 -1 -1 1 1 1 -1 1 -1 480.3
4 4 1 1 1 -1 -1 1 -1 -1 -1 -1 1 -1 -1 1 1 1 406.3
5 5 1 -1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 1 -1 212.9
6 6 1 1 -1 1 -1 -1 1 -1 -1 1 -1 -1 1 -1 1 1 478.7
7 7 1 -1 1 1 -1 -1 -1 1 1 -1 -1 -1 1 1 -1 1 396.5
8 8 1 1 1 1 -1 1 1 -1 1 -1 -1 1 -1 -1 -1 -1 349.7
9 9 1 -1 -1 -1 1 1 1 -1 1 -1 -1 -1 1 1 1 -1 119.7
10 10 1 1 -1 -1 1 -1 -1 1 1 -1 -1 1 -1 -1 1 1 372.2
11 11 1 -1 1 -1 1 -1 1 -1 -1 1 -1 1 -1 1 -1 1 411.6
12 12 1 1 1 -1 1 1 -1 1 -1 1 -1 -1 1 -1 -1 -1 382.8
13 13 1 -1 -1 1 1 1 -1 -1 -1 -1 1 1 1 -1 -1 1 161.2
14 14 1 1 -1 1 1 -1 1 1 -1 -1 1 -1 -1 1 -1 -1 424.3
15 15 1 -1 1 1 1 -1 -1 -1 1 1 1 -1 -1 -1 1 -1 322.8
16 16 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 302.1
17 17 1 0 0 0 0 0 0 0 0 0 0 0 -1 1 0 0 302.4
18 18 1 0 0 0 0 0 0 0 0 0 0 0 1 -1 0 0 318.2
19 19 1 0 0 0 0 0 0 0 0 0 0 0 -1 1 0 0 332.8
> data
###Factors
> A
[1] -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 0 0 0
Levels: -1 0 1
> B
[1] -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 0 0 0
Levels: -1 0 1
> C
[1] -1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 1 1 1 1 0 0 0
Levels: -1 0 1
> D
[1] -1 -1 -1 -1 -1 -1 -1 -1 1 1 1 1 1 1 1 1 0 0 0
Levels: -1 0 1
####Response variable
> data$y
[1] 190.9 436.2 480.3 406.3 212.9 478.7 396.5 349.7 119.7 372.2 411.6 382.8 161.2 424.3 322.8 302.1 302.4 318.2
[19] 332.8
A=as.factor(data$A)
B=as.factor(data$B)
C=as.factor(data$C)
D=as.factor(data$D)
out3=lm(data$y~C+B+A+D)
fit1=aov(out3)
summary(fit1)
> summary(fit1)
Df Sum Sq Mean Sq F value Pr(>F)
C 2 2743 1372 0.170 0.8456
B 1 26896 26896 3.332 0.0910 .
A 1 45839 45839 5.679 0.0331 *
D 1 12928 12928 1.602 0.2279
Residuals 13 104934 8072
同ANOVA,利用不同的顺序可变
摘要(FIT1)的 Df的总平均平方F值Pr(> F)
B 2 28199 14100 1.747 0.2129
A 1 45839 45839 5.679 0.0331 * d 1 12928 12928 1.602 0.2279
的C 1 1440 1440 0.178 0.6796
残差13 104934 8072
如果我只用2级(进行ANOVA对所有变量排除0 ,并且仅在最后3个数据基于“0”级别时才使用[1:16]数据),那么它就会很好。对于所有变种但残差我得到1的Df。
我认为这必须与结果模型矩阵不是满秩的事实有关,这意味着4个因子的虚拟变量之间存在线性相关性。你能提供一些关于阶乘设计的更多细节吗? – johansteen 2014-11-23 20:34:03
我添加了完整的数据集和另一个变量顺序不同的anova。我尝试了很多东西,但是我只保留第一个变量的Df值为2。 – Kane 2014-11-23 20:46:10
请提供一些关于您的因子设计的详细信息(例如完整或部分因子,因子数量,每个因子的等级数量......)!不知何故,在我看来,好像你可能将原始因素与他们的虚拟变量混合在一起,但我只能确切地知道是否可以获得有关因子设计的更多细节。 – johansteen 2014-11-23 21:32:29