0
我有一些来自Illumina NextSeq运行的.fastq文件。许多序列具有polyA片段,这使得它们映射变得复杂。我想删除的连续十A的所有序列,并一直在努力这样做,使用fastx_clipper如下:fastx_trimmer为什么认为我的fastq文件是未知文件格式?
ha1c6n8$ fastx_clipper -l 32 -Q33 -n -v -a AAAAAAAAAA –i FR0826_S1_L004_R1_001.fastq –o FR0826_L004_trimmed.fastq
这导致以下错误信息:
fastx_clipper: input file (-) has unknown file format (not FASTA or FASTQ), first character = (10)
我不完全肯定这是什么意思。我看着使用头的fastq文件:
ha5c6n8$ head FR0826_S1_L004_R1_001.fastq
@NS500289:18:H1237BGXX:4:11401:2791:1023 1:N:0:1
NCTACATTGGTTCCTCAGCCAAGCACATACACCAAATGTCTGAACCTGCGGTACCTCTCGTACTGAGCAGGATT
+
#<<AAFAFFFAFFFFF7FF)FF.F<FAFFFFF<FF.AFFF7F.F.FFAFFFF)7AF7F<FFF<<F7FFFFFF7F
@NS500289:18:H1237BGXX:4:11401:19266:1023 1:N:0:1
NAATGGGTCTGCGAGAGCGCCAGCTATCCTGAGGGAAACTTCGGAGGGGGCCGGCTACTAGATGGTTCGCTTAGT
+
#<7AAFAFFFFFFFF7FFAA.AFF<F...<AFFFF7F..FA.A<AA<F7)FA7.FF.<FA..F.A7AF..FFF.A
@NS500289:18:H1237BGXX:4:11401:6297:1023 1:N:0:1
NATAAGAGGGGTGTGGCTAGGCTAAGCGTTTTGAGCTGCATTGCTGCGTGCTTGATGCTTGTCCCTTTTGATCGT
据我所知,这看起来像一个完全正常的fastq格式文件。任何人都可以解释什么导致这个错误? 谢谢!
在我看来,这个问题不太适合于stackoverflow。如果我是你,我会开始用fastq验证器检查你的fastq文件进行调试,看看是否有警告和错误。您的文件可能例如被截断,我们无法从前几行看到这一点。 – cel 2014-08-29 08:05:17