三个测量(时间)嵌套在嵌套在人员(ID)中的Networkpartners(NP)中。变量NP.T(根据回答here创建)指示特定人员(ID)具有特定度量(1到3)的网络伙伴的数量(结果中没有缺失值)。用于重复测量纵向的平均值,方差分析
这是我的数据集的一个例子,真正的数据集有数千行。
ID NP Time Outcome NP.T
1 1 11 1 4 2
2 1 12 1 2 2
3 1 11 2 3 2
4 1 12 2 3 2
5 1 11 3 NA 1
6 1 12 3 3 1
7 2 21 1 2 2
8 2 22 1 4 2
9 2 21 2 NA 1
10 2 22 2 4 1
11 2 21 3 NA 1
12 2 22 3 4 1
我想计算下面的东西和DONOT知道如何正确地做到这一点:
一)平均,SD在每次测量(NP.T)networkpartners的数量。
此外,我对每次测量时至少命名一个Networkpartner的人数(ID)感兴趣。
T1 - > 2点的ID命名至少一个Networkpartner
T2 - > 2点的ID命名至少一个NP
T3 - > 2点的ID命名至少一个NP
这可能听起来微不足道在这个例子中,但它不在我的示例中。为了计算手段,sds等。每次我只想在那个特定时间只考虑那些实际命名至少一个网络伙伴的ID。在特定时间没有命名任何NP的ID不应该成为该时间点描述性统计的一部分。 澄清:如果在输出变量上存在NA,则意味着该NP在该时间点没有被它的ID命名。
B)reapeated测量方差分析,以找出是否的networkpartners变化在时间
一些预期结果的平均数:
Mean.T1 = 2 < - 既是标识了两个名为纳米粒子在T1
Mean.T2 = 1.5 < - 为一个ID已命名的两个中的另一个在NP T2
Mean.T3 = 1 < - 既是ID的已命名的一个NP在T3
n.T1 = 2
n.T2 = 2
n.T3 = 2
的问题是,在现实的数据集的所有人员命名不同量Networkpartners的,所以我不知道如何计算这种情况下的描述性统计。
你想NP.T或NP的意思吗?这不是更清晰的给我!如果可能的话,请张贴在你的问题中给定的样本预期的输出。 – Metrics
预期结果出现错误,我现在纠正了它 – user2647568
您想要'tapply','aggregate'和/或'by'。 –