我正在研究一个项目(我必须在Perl中实现它,但我不擅长)读取DNA并找到它的RNA。将该RNA分成三联体以获得其相应的蛋白质名称。我将解释以下步骤:DNA到RNA和用Perl获取蛋白质
1)转录以下DNA的RNA,然后使用遗传密码翻译成的氨基酸序列
实施例:
TCATAATACGTTTTGTATTCGCCAGCGCTTCGGTGT
2)转录的DNA,第一替换各DNA为它的对应物(即,G为C,C为G,T为A和A为T):
TCATAATACGTTTTGTATTCGCCAGCGCTTCGGTGT
AGTATTATGCAAAACATAAGCGGTCGCGAAGCCACA
接着,请记住,胸腺嘧啶(T)碱基成为Uraci l(U)。因此,我们的顺序变为:
AGUAUUAUGCAAAACAUAAGCGGUCGCGAAGCCACA
使用遗传密码就是这样
AGU AUU AUG CAA AAC AUA AGC GGU CGC GAA GCC ACA
再看看每个三联(密码)了遗传密码的表格。所以AGU变成丝氨酸,我们可以为丝氨酸写或 只是S. AUU变成异亮氨酸(ILE),这是我们写成I.这样进行的,我们得到:
SIMQNISGREAT
我会给蛋白质表:
因此,如何能我写在Perl代码?我将编辑我的问题并编写我所做的代码。
听起来像功课......反正,你见过BioPerl吗?该项目对生物学有很大的用处。 – ekawas 2011-03-21 20:03:30