我有一个文件,有很多的字母序列。
其中一些序列可能是相同的,所以我想比较一下。
我在做这样的事情,但是这不正是想我想要的东西:文件的比较文件内部字母序列的最佳方法?
for line in fl:
line = line.split()
for elem in line:
if '>' in elem:
pass
else:
for el in line:
if elem == el:
print elem, el
例如:
>1
GTCGTCGAAGCATGCCGGGCCCGCTTCGTGTTCGCTGATA
>2
GTCGTCGAAAGAGGTCT-GACCGCTTCGCGCCCGCTGGTA
>3
GTCGTCGAAAGAGGCTT-GCCCGCCACGCGCCCGCTGATA
>4
GTCGTCGAAAGAGGCTT-GCCCGCTACGCGCCCCCTGATA
>5
GTCGTCGAAAGAGGTCT-GACCGCTTCGCGCCCGCTGGTA
>6
GTCGTCGAAAGAGTCTGACCGCTTCTCGCCCGCTGATACG
>7
GTCGTCGAAAGAGGTCT-GACCGCTTCTCGCCCGCTGATA
所以我想什么,如果已知如果任何序列完全等于1,或等于2,依此类推。
(1)每行有多少个序列? (2)您是否试图查找一行中的序列是否与同一行中的其他序列匹配,或者行中的序列是否与同一文件中的其他序列匹配? (3)你可以发布一些样本行吗? – 2010-09-09 11:03:29
你想比较多少个序列? – 2010-09-09 11:13:35
你只需要知道有匹配,还是你需要的位置呢? – 2010-09-09 11:14:05