我是一名Python初学者(我是一名生物学家),我有一个包含特定软件结果的文件,我想用python解析结果。从下面的输出中,我想得到的只是分数,并希望将序列分成单独的氨基酸。使用python解析结果
没有。得分顺序
1 0.273778 FFHH-YYFLHRRRKKCCNNN-CCCK---HQQ---HHKKHV-FGGGE-EDDEDEEEEEEEE-EE--
2 0.394647 IIVVIVVVVIVVVVVVVVVV-CCCVA-IVVI--LIIIIIIIIYYYA-AVVVVVVVAAAAV-AST-
3 0.456667 FIVVIVVVVIXXXXIGGGGT-CCCCAV -------------IVBBB-AAAAAA--------AAAA-
4 0.407581 MMLMILLLLMVVAIILLIII-LLLIVLLAVVVVVAAAVAAVAIIII-ILIIIIIILVIMKKMLA-
5 0.331761 AANSRQSNAAQRRQCSNNNR-RALERGGMFFRRKQNNQKQKKHHHY-FYFYYSNNWWFFFFFFR-
6 0.452381 EEEEDEEEEEEEEEEEEEEE-EEEEESSTSTTTAEEEEEEEEEEEE-EEEEEEEEEEEEEEEEE-
7 0.460385 LLLLLLLLMMIIILLLIIII-IIILLVILMMEEFLLLLILIVLLLM-LLLLLLLLLLVILLLVL-
8 0.438680 ILILLVVVVILVVVLQLLMM-QKQLIVVLLVIIMLLLLMLLSIIIS-SMMMILFFLLILIIVVL-
9 0.393291 QQQDEEEQAAEEEDEKGSSD-QQEQDDQDEEAAAHQLESSATVVQR-QQQQQVVYTHSTVTTTE-
从上面的表格,我想获得相同数量,分数,但其单独的序列表(纵列) 所以它应该看起来像
no. score amino acid(1st column)
1 0.273778 F
2 0.395657 I
3 0.456667 F
另一个表代表第二列氨基酸
no score amino acid (2nd column)
1 0.273778 F
2 0.395657 I
3 0.456667 I
第三个表代表氨基酸的第三列和第四个第四列的表氨基酸MN等
在此先感谢您的帮助
什么的'F','I'和'F'立场?这些是上面字符串的第一个字符吗?为什么'f'在第三行而不是'F'?我们不是Python的初学者,但我们也不是生物学家。我们可以用Python来帮助你,但你必须解释这里的个别氨基酸是什么。 – eumiro
它应该为F ...我已编辑了问题(F,I; F)。是氨基酸代码,这是alignment.I愿与得分分裂整个sequnece纵列的序列的结果和序列号。 – hari
你的描述如何去信件仍然不完全清楚。也许最好在序列中添加一些例子以及如何获得理想的结果。 – hochl