我有一些我需要分析的fastaq
文件。主要问题是我目前使用的分析工具只接受ACTG
作为核苷酸,而不接受IUPAC代码(R
,W
等)中的其余术语。替换Linux中的FastaQ文件中的特定核苷酸
我做了这个代码更改的特定核苷酸:
awk '{
split($2,a,"") ;
str="" ;
for (n in a) {nucleotide=a[n]} ;
if (nucleotide~/[ACTG]/) {str=str""nucleotide}
else {
if (nucleotide~/[RWMV]/) {str=str""A}
else {
if (nucleotide~/[YD]/) {str=str""C}
else {
if (nucleotide~/[SKN]/) {str=str""G}
else {str=str""T}
}
}
}
}' | head
这是工作,但它是超慢。你知道更有效的方法吗?
非常感谢!
'为(N a)中的{核苷酸= a [n]};'工作不好 –
您的预期产出是?和示例输入? –
你对末尾的变量'str'没有任何作用 –