我有一个这样的文件值:平均柱如果在另一列匹配和打印作为附加列
Score 1 24 HG 1
Score 2 26 HG 2
Score 5 56 RP 0.5
Score 7 82 RP 1
Score 12 97 GM 5
Score 32 104 LS 3
我想平均5栏如果塔4是相同的,并且打印该平均值作为6列,以便它看起来像这样:
Score 1 24 HG 1 1.5
Score 2 26 HG 2 1.5
Score 5 56 RP 0.5 0.75
Score 7 82 RP 1 0.75
Score 12 97 GM 5 5
Score 32 104 LS 3 3
我已经尝试了几个解决方案,我发现在这里。 例如
awk '{ total[$4] += $5; ++n[$4] } END { for(i in total) print i, total[i]/n[i] }'
,但他们都结束了这一点:
HG 1.5
RP 0.75
GM 5
LS 3
,因为我失去了很多的信息,这是不可取的。
列4中的值是否总是相邻? – choroba
他们永远是。 – markryan