我想发现文本中的DNA序列中发现的ASCII编码的文本。在Python中解码
下面是我的代码:
首先是打开FASTA文件,并设置是一个变量。
with open("/home/<username>/python/progseq") as mydnaseq:
sequence = mydnaseq.read().replace('\n','')
这第二位的序列转化为二进制,这样做,对字母C和G/T等于1:
binarysequence = sequence.replace('A','0')
然后我把这个loooooong二进制序列,并想使成8位:
for i in range(0,len(binarysequence),8):
binarysequence [i:i+8]
然后,这创建这样的输出:
'00110100'
'00110010'
'01000110'
'00011000'
'0'
虽然我有更长的输出,但我只包含了最后四个序列。
想知道如何将其转换为字母。
您可以使用'sequence.encode()'将ASCII字符串转换为二进制(字节)。该函数用其8位ASCII码charcode替换每个字符。例如,'A'变成65.但你打算用这些位来做什么? – DyZ
你好@DYZ,谢谢你的回复。我想用各自的ASCII字符替换这些8位系列(不只是这四个),因为我被告知它假设要揭示一首诗。我只是不知道现在怎么样,并且想知道是使用encode()还是decode(),或者是否有不同的接近方式。我希望我有道理。我是编程界的新手。 –
我不应该使用ord(),而是相应地翻译每个字母([A,C = 0] [T,G = 1])。我只是不确定现在从哪里开始。 –