我有一个广泛格式的数据框,它具有干预前和干预后问卷分数。有848名患者至少有一份问卷。我想看看这些数据来比较分数从干预前到干预后的变化。但是,由于这些数据的格式很广泛,数据在每个患者的问卷数量方面并不统一,所以我很挣扎。有一个变量列出了调查问卷的实例,问卷的价值是另一个变量。R中的宽格式变量结合
这里是它目前的样子的例子:
a=c('instance1','total1','instance2', 'total2', 'instance3', 'total3',
'instance4','total4', 'instance5','total5')
b=c('postop2', '5', 'postop1', '7', NA, NA, 'preop', '10', NA, NA)
c=c(NA, NA, 'preop', '3', NA, NA, 'postop1', '4', 'postop2', '3')
data.frame(rbind(a,b,c))
有848行问卷调查数据。
我需要计算从preop到postop问卷的差异。重组这些数据的最佳方法是什么,以便我可以获得这些值?由于所有848名患者之间的情况不一致,我正在挣扎。
感谢您的帮助。
如果你看看你的例子,我假设列名将是第一行而不是'X1','X2'等。 – akrun
是的,列名是第一行 –