2013-08-03 44 views
0

三个测量(时间)嵌套在嵌套在人员(ID)中的Networkpartners(NP)中。变量NP.T(根据回答here创建)指示特定人员(ID)具有特定度量(1到3)的网络伙伴的数量(结果中没有缺失值)。用于重复测量纵向的平均值,方差分析

这是我的数据集的一个例子,真正的数据集有数千行。

ID NP Time Outcome NP.T 
1 1 11 1  4 2 
2 1 12 1  2 2 
3 1 11 2  3 2 
4 1 12 2  3 2 
5 1 11 3  NA 1 
6 1 12 3  3 1 
7 2 21 1  2 2 
8 2 22 1  4 2 
9 2 21 2  NA 1 
10 2 22 2  4 1 
11 2 21 3  NA 1 
12 2 22 3  4 1 

我想计算下面的东西和DONOT知道如何正确地做到这一点:

一)平均,SD在每次测量(NP.T)networkpartners的数量。

此外,我对每次测量时至少命名一个Networkpartner的人数(ID)感兴趣。

T1 - > 2点的ID命名至少一个Networkpartner

T2 - > 2点的ID命名至少一个NP

T3 - > 2点的ID命名至少一个NP

这可能听起来微不足道在这个例子中,但它不在我的示例中。为了计算手段,sds等。每次我只想在那个特定时间只考虑那些实际命名至少一个网络伙伴的ID。在特定时间没有命名任何NP的ID不应该成为该时间点描述性统计的一部分。 澄清:如果在输出变量上存在NA,则意味着该NP在该时间点没有被它的ID命名。

B)reapeated测量方差分析,以找出是否的networkpartners变化在时间

一些预期结果的平均数:

Mean.T1 = 2 < - 既是标识了两个名为纳米粒子在T1

Mean.T2 = 1.5 < - 为一个ID已命名的两个中的另一个在NP T2

Mean.T3 = 1 < - 既是ID的已命名的一个NP在T3

n.T1 = 2

n.T2 = 2

n.T3 = 2

的问题是,在现实的数据集的所有人员命名不同量Networkpartners的,所以我不知道如何计算这种情况下的描述性统计。

+0

你想NP.T或NP的意思吗?这不是更清晰的给我!如果可能的话,请张贴在你的问题中给定的样本预期的输出。 – Metrics

+0

预期结果出现错误,我现在纠正了它 – user2647568

+1

您想要'tapply','aggregate'和/或'by'。 –

回答

1

部分A(1 & 2)

library(plyr) 
mydata3<-ddply(mydata1,.(Time),summarize,mean=mean(NP.T),sd=sd(NP.T),nobs=length(unique(ID))) 


> mydata3 
    Time mean  sd nobs 
1 1 2.0 0.0000000 2 
2 2 1.5 0.5773503 2 
3 3 1.0 0.0000000 2 

部分B:

myaov <- aov(mean ~ Time, data=mydata3)

> myaov 

    Call: 
     aov(formula = mean ~ Time, data = mydata3) 

    Terms: 
        Time Residuals 
    Sum of Squares 0.5  0.0 
    Deg. of Freedom 1   1 

    Residual standard error: 1.17148e-16 
    Estimated effects may be unbalanced 

Uodated:对于错误Error in is.list(by) : 'by' is missing,请检查here为DETA ILS。正如在网站中提到的,这个问题不是RStudio的问题,而是Hmisc库从包'plyr'掩盖功能summarize的问题。

因此,您需要在前面的代码中添加library(Hmisc)

library(plyr) 
library(Hmisc) 
    mydata3<-ddply(mydata1,.(Time),summarize,mean=mean(NP.T),sd=sd(NP.T),nobs=length(unique(ID))) 
+0

编辑我的问题 – user2647568

+0

请解释这些是什么意思:n.T1 = 2,n.T2 = 2 n.T3 = 2 – Metrics

+0

n.T1 = 2 - >两个ID至少为1每个T1都有NP,因此在计算描述性统计时考虑到了 – user2647568

相关问题