2013-04-26 174 views
1

我试图获得适合我数据的lm。我遇到的问题是我想在因子为“真”时拟合线性模型(一阶多项式),在因子为“假”时拟合二阶多项式。我怎样才能完成使用只有一个LM。R lm与分类和平方连续变量的交互作用

a=c(1,2,3,4,5,6,7,8,9,10) 
b=factor(c("true","false","true","false","true","false","true","false","true","false")) 
c=c(10,8,20,15,30,21,40,25,50,31) 
DumbData<-data.frame(cbind(a,c)) 
DumbData<-cbind(DumbData,b=b) 

我已经试过

Lm2<-lm(c~a + b + b*I(a^2), data=DumbData) 
summary(Lm2) 

导致:

summary(Lm2) 
Call: 
lm(formula = c ~ a + b + b * I(a^2), data = DumbData) 

Coefficients: 
      Estimate Std. Error t value Pr(>|t|)  
(Intercept) -0.74483 1.12047 -0.665 0.535640  
a    4.44433 0.39619 11.218 9.83e-05 *** 
btrue   6.78670 0.78299 8.668 0.000338 *** 
I(a^2)  -0.13457 0.03324 -4.049 0.009840 ** 
btrue:I(a^2) 0.18719 0.01620 11.558 8.51e-05 *** 
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 0.7537 on 5 degrees of freedom 
Multiple R-squared: 0.9982, Adjusted R-squared: 0.9967 
F-statistic: 688 on 4 and 5 DF, p-value: 4.896e-07 

这里我有我(一^ 2)对于既配合,我想1只月1日为了和另一个与第二阶多项式。 如果有人尝试:

Lm2<-lm(c~a + b + I(b*I(a^2)), data=DumbData) 
Error in `contrasts<-`(`*tmp*`, value = contr.funs[1 + isOF[nn]]) : 
    contrasts can be applied only to factors with 2 or more levels 
In addition: Warning message: 
In Ops.factor(b, I(a^2)) : * not meaningful for factors 

我怎样才能得到适当的互动条款?

谢谢安德烈,我还有一些东西在这里失踪。在这个例子中,变量b是逻辑1,如果是两个级别的因子不起作用,我想我必须将因子变量转换为逻辑1。我缺少的另一件事是不在条件中,我(!b * a^2)没有!我得到:

Call: lm(formula = c ~ a + I(b * a^2), data = dat) 
Coefficients: Estimate Std. Error t value Pr(>|t|) 
(Intercept) 7.2692 1.8425 3.945 0.005565 ** 
a   2.3222 0.3258 7.128 0.000189 *** 
I(b * a^2) 0.3005 0.0355 8.465 6.34e-05 *** 

我不能将公式与有和没有!条件,这对我来说有点奇怪。

回答

1

尝试一些大意如下:

dat <- data.frame(
    a=c(1,2,3,4,5,6,7,8,9,10), 
    b=c(TRUE,FALSE,TRUE,FALSE,TRUE,FALSE,TRUE,FALSE,TRUE,FALSE), 
    c=c(10,8,20,15,30,21,40,25,50,31) 
) 

fit <- lm(c ~ a + I(!b * a^2), dat) 
summary(fit) 

这导致:

Call: 
lm(formula = c ~ a + I(!b * a^2), data = dat) 

Residuals: 
    Min  1Q Median  3Q Max 
-4.60 -2.65 0.50 2.65 4.40 

Coefficients: 
       Estimate Std. Error t value Pr(>|t|)  
(Intercept)  10.5000  2.6950 3.896 0.005928 ** 
a     3.9000  0.4209 9.266 3.53e-05 *** 
I(!b * a^2)TRUE -13.9000  2.4178 -5.749 0.000699 *** 
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 3.764 on 7 degrees of freedom 
Multiple R-squared: 0.9367, Adjusted R-squared: 0.9186 
F-statistic: 51.75 on 2 and 7 DF, p-value: 6.398e-05 

注:

  • 我利用逻辑值TRUEFALSE的。
  • 这些将分别强制为1和0。
  • 我在公式中使用否定!b
+0

谢谢安德烈,我还有些东西在这里。在这个例子中,变量b是逻辑1,如果是两个级别的因子不起作用,我想我必须将因子变量转换为逻辑1。我缺少的另一件事是不在条件中,我(!b * a^2)没有!我得到:电话: lm(公式= c〜a + I(b * a^2),data = dat) 系数: 估计标准。误差t值Pr(> | t |) (截距)7.2692 1.8425 3.945 0.005565 ** a 2.3222 0.3258 7.128 0.000189 *** I(b * a^2)0.3005 0.0355 8.465 6.34e-05 *** – 2013-04-29 18:28:22

1

嗯...

Lm2<-lm(c~a + b + b*I(a^2), data=DumbData) 

你说,“我遇到的问题是,我想,以适应线性模型(一阶多项式)时的因素是‘真’和第二当我使用一个lm,我怎么能做到这一点?“

从这我推断你不希望b直接在模型中?另外,只有在b为假时才应包含^ 2。

因此,这将是...

lm(c~ a + I((!b) * a^2)) 

如果b为真(即!b等于FALSE),那么^ 2由零(FALSE)相乘,从方程省略。

唯一的问题是,您已将b定义为因子而不是logical。这可以治愈。

# b=factor(c("true","false","true","false","true","false","true","false","true","false")) 
# could use TRUE and FALSE instead of "ture" and "false" 
# alternatively, after defining b as above, do 
# b <- b=="true" -- that would convert b to logical (i.e boolean TRUE and FALSe values) 

确定是精确的,则定义B中“字符”,但它被转换为“因素”将其添加到所述数据帧(“DumbData”)

关于你的方式另一个小点时定义了数据框。

a=c(1,2,3,4,5,6,7,8,9,10) 
b=factor(c("true","false","true","false","true","false","true","false","true","false")) 
c=c(10,8,20,15,30,21,40,25,50,31) 
DumbData<-data.frame(cbind(a,c)) 
DumbData<-cbind(DumbData,b=b) 

在这里,cbind是不必要的。你coud拥有一切在同一行:

Dumbdata<- data.frame(a,b,c) 
# shorter and cleaner!! 

此外,与B转换为logical使用:

Dumbdata<- data.frame(a,b=b=="true",c) 

注意。你需要说b = b ==“true”,它似乎是多余的,但是LHS(b)给出了数据框中变量的名字,而RHS(b ==“true”)是一个表达式,逻辑“(布尔)值。