2014-10-10 262 views
0

文件1:比较两个文件的两列,并给予有条件的

chr pos1 sample Gene 
chr1 123 sample1 x 
chr1 234 sample2 Y 
chr2 345 sample2 z 

文件2:

sample Gene chr pos1 
sample1 x chr1 123 
sample2 A chr1 234 
sample2 c chr3 123 
sample2 z chr2 345 

我用awk 'NR==FNR{A[$1,$2]++;next}A[$3,$4]'file1 file2得到共同作用的结果,就像聪明的我试图

awk 'NR==FNR{A[FNR]=[$1,$2]++;next}{print A[$3,$4]==A[FNR] ? $0"\t"1 :$0"\t"0}' file1 file2 

但出现错误。

+0

我认为你错过了这个数组的名字,在'='右边'A [FNR] = [$ 1,$ 2] ++' – Ashkan 2014-10-10 08:22:56

回答

1

print A[$3,$4]==A[FNR]`

是错了,因为在你使用FNR作为指数firest动作,在这里你正在使用`$ 3,$ 4

`A[FNR]=[$1,$2]++;` 

我不明白你使用++这里?

你应该使用的东西线

awk 'NR==FNR{A[FNR]=$0;}NR!=FNR{split(A[FNR],line); if (line[1] == $3 && line[2]==$4) print $0 1; else print $0 0}' file1 file2 

,这将给输出作为

sample Gene chr pos1 1 
sample1 x chr1 123 1 
sample2 A chr1 234 1 
sample2 c chr3 123 0 
sample2 z chr2 345 0 

这里的第一个文件,NR==FNR整条生产线将被复制到arrray A和第二个文件当NR!=FNR阵列被拆分split并与$3$4