我有像这样如何删除包含Ns个
">ENS..._intronX
acgtacgtacgtacgt
">ENS..._intronY
acgtacgtNNNNa
acgtacgtacgtacgt
">ENS..._intronZ
acgtacgtacgtacgt
acgtacgtacgtacgt
我需要在一排与至少2 N
以除去序列(因为这些内含子misannotated)一个FASTA文件的fasta格式化的序列。
在此,这将是序列" >ENS..._intronY "
(第3行,图4和5应被删除)
任何建议?
谢谢
应该用N +来代替NNNN吗? –
@BugKiller,叹气,'ENS'中的'N'导致所有记录不符合条件 – iruvar
downvoter,我想这是关于awk不是解析fasta文件的正确工具,但是请解释 – iruvar