2016-11-25 48 views
0

我想替换下面的文件中的第二列,但不是所有行。gawk替换列和增量,但不是所有行

我尝试这样做: gawk 'BEGIN{a=0} {gsub($2, a++); print $0}' filein > fileout;

但部分弄乱了一些线路,比如它说:TER和结束。

FILEIN看起来是这样的: ATOM 6513 N CYX D 438 6.267 -19.583 33.328 1.00 99.72 N ATOM 6514 CA CYX D 438 5.026 -19.379 34.078 1.00 99.72 C ATOM 6515 C CYX D 438 5.441 -19.597 35.520 1.00 99.72 C ATOM 6516 O CYX D 438 4.662 -19.960 36.400 1.00 99.72 O ATOM 6517 CB CYX D 438 3.940 -20.381 33.611 1.00 99.72 C ATOM 6518 SG CYX D 438 3.155 -19.991 32.020 1.00 99.72 S TER HETATM 1 C1 L35 900 -11.042 -69.780 -18.443 1.00 0.00 C HETATM 2 C2 L35 900 -9.989 -68.975 -18.009 1.00 0.00 C HETATM 3 C3 L35 900 -11.968 -70.232 -17.506 1.00 0.00 C CONECT 324 1315 CONECT 2005 2938 CONECT 3228 6518 CONECT 3528 4682 CONECT 5373 6190 ENDMDL END

我想要的文件看起来像这样:

ATOM 1 N CYX D 438 6.267 -19.583 33.328 1.00 99.72 N ATOM 2 CA CYX D 438 5.026 -19.379 34.078 1.00 99.72 C ATOM 3 C CYX D 438 5.441 -19.597 35.520 1.00 99.72 C ATOM 4 O CYX D 438 4.662 -19.960 36.400 1.00 99.72 O ATOM 5 CB CYX D 438 3.940 -20.381 33.611 1.00 99.72 C ATOM 6 SG CYX D 438 3.155 -19.991 32.020 1.00 99.72 S TER HETATM 7 C1 L35 900 -11.042 -69.780 -18.443 1.00 0.00 C HETATM 8 C2 L35 900 -9.989 -68.975 -18.009 1.00 0.00 C HETATM 9 C3 L35 900 -11.968 -70.232 -17.506 1.00 0.00 C CONECT 324 1315 CONECT 2005 2938 CONECT 3228 6518 CONECT 3528 4682 CONECT 5373 6190 ENDMDL END

+0

你的'fileout'看起来像什么? – bli

+0

gawk是awk的一个变种。 ** FAR **如果使用awk而不是gawk标记,或者除了gawk标记,则会有更多人看到您的问题。你几周前可能已经有了答案。 –

回答

0

所以,如果你想寻找的字符串(TER,联系,ENDML)不被包括在内,那么下面的内容可能会帮助你。

awk 'NF>1 && $1 !~ /TER/ && $1 !~ /CONECT/ && $1 !~ /ENDMDL/ && $1 !~ /END/{$2=++a} 1' Input_file 

如果你的Input_file有字符串(ENDMDL,END)总是1列条目,那么你可以尝试下面的方法。

awk 'NF>1 && $1 !~ /TER/ && $1 !~ /CONECT/{$2=++a} 1' Input_file 

我希望这可以帮助你。

+1

所有你需要测试的是'NF> 3'。请注意,'$ 2 = ++ a'将会改变字段之间的空格,而'sub($ 2,++ a)'不会。 –