1
如果我使用下面链接中的FASTA文件,我应该在Biopython中使用哪种字母类型?会不会是IUPAC.unambiguous_dna?我应该在Biopython中使用哪种字母表类型与FASTA文件?
链接FASTA文件:http://hgdownload.cse.ucsc.edu/goldenPath/hg19/chromosomes/?C=S;O=A
如果我使用下面链接中的FASTA文件,我应该在Biopython中使用哪种字母类型?会不会是IUPAC.unambiguous_dna?我应该在Biopython中使用哪种字母表类型与FASTA文件?
链接FASTA文件:http://hgdownload.cse.ucsc.edu/goldenPath/hg19/chromosomes/?C=S;O=A
你看过3.1 Sequences and Alphabets?它解释了可用的不同字母,以及它们覆盖的情况。
您提供的链接中有很多序列(对于我们来说太多了,无法完成)。我的建议是去UnambiguousDNA
。如果四个基本核苷酸不够,解析器将会发出抱怨,并且您应该选择更广泛的字母表。
我会建议询问biostars.org,更有可能在那里找到更好的答案 – Stedy 2013-03-18 01:08:13