fasta

    -1热度

    1回答

    我写了一个PERL程序,该程序需要一个Excel工作表(通过将.xls扩展名改为.txt来转换为文本文件)以及一个用于输入的序列文件。 Excel工作表包含序列文件中某个区域的起始点和结束点(以及匹配区域任一侧的70个侧翼值),这些文件需要剪切并提取到第三个输出文件中。有300个值。程序读入每次需要切割的序列的起始点和结束点,但它重复告诉我,如果显然不是输入文件的长度,则该值超出了该长度。我只是不

    -3热度

    1回答

    我有一个包含40 000个fasta序列(大约)的文件。我想将这个文件分成4个文件,其中包含10 000个fasta序列。 我该怎么做? 反馈意见。 谢谢。 jd

    0热度

    1回答

    我试图将fastq转换为fasta而不先做一个质量过滤器。当我尝试使用fastx工具包来运行此转换时,它在运行到低质量基础时会给我一条错误消息,并终止转换,以便转换后的输出很早结束。 (错误表示质量得分低于-30)。 然后,我尝试使用此论坛中较早发布的sed解决方案,介绍如何使用sed转换为fasta。该生产线是这样的: sed -n '1~4s/^@/>/p;2~4p' 行我输入端子为: s

    0热度

    1回答

    请指导我使用biosmalltalk(Pharo版)将GenBank序列转换为等效的FASTA格式。我已经想通过磁盘读取GenBank文件: |文件x y m | x:=时间millisecondClockValue。 file:= BioFile on:(FileStream readOnlyFileNamed:BioObject testFilesDirectoryName asFileRef

    0热度

    3回答

    我对你所有的awk/sed/perl专家有个疑问。我遇到具有以下格式如文件: >GALHOMG00000016026_1 GALHOMT00000016026_1 GALHOMP00000016026_1 JH556633.1:35740-45316 1 MPKKKTGARKKAENRREREKQIRASRANIDLAKHPCNASMECDKCQRRQKNRAFCYFCNS VQKLPICAQ

    2热度

    4回答

    我经常需要在fasta文件中查找特定的序列并将其打印出来。对于那些不知道的人,fasta是生物序列(DNA,蛋白质等)的文本文件格式。这很简单,你有一个序列名前面有一个'>'的行,然后直到下一个'>'后面的所有行都是序列本身。例如: >sequence1 ACTGACTGACTGACTG >sequence2 ACTGACTGACTGACTG ACTGACTGACTGACTG >sequ

    1热度

    2回答

    我需要最琐碎的解决方案转换fasta.txt包含多个核苷酸序列等 >seq1 TAGATTCTGAGTTATCTCTTGCATTAGCAGGTCATCCTGGTCAAACCGCTACTGTTCCGG CTTTCTGATAATTGATAGCATACGCTGCGAACCCACGGAAGGGGGTCGAGGACAGTGGTG >seq2 TCCCTCTAGAGGCTCTTTACCGTGATGCT

    0热度

    1回答

    我在Biostars上发布了这个同样的窘境,但它似乎像交通低,所以我想我可能在这里构成。 我试图用Bioconductor的的“Biostrings”包和“DNAStringSet”功能导入序列的FASTA文件为R,但我不断收到同样的错误: Error in .Call2("new_XString_from_CHARACTER", classname, x, start(solved_SEW),

    0热度

    1回答

    我有一些来自Illumina NextSeq运行的.fastq文件。许多序列具有polyA片段,这使得它们映射变得复杂。我想删除的连续十A的所有序列,并一直在努力这样做,使用fastx_clipper如下: ha1c6n8$ fastx_clipper -l 32 -Q33 -n -v -a AAAAAAAAAA –i FR0826_S1_L004_R1_001.fastq –o FR0826_L

    0热度

    1回答

    我的名单看起来是这样的: ['', 'CCCTTTCGCGACTAGCTAATCTGGCATTGTCAATACAGCGACGTTTCCGTTACCCGGGTGCTGACTTCATACTT CGAAGA', 'ACCGGGCCGCGGCTACTGGACCCATATCATGAACCGCAGGTG', '', '', 'AGATAAGCGTATCACG ACCTCGTGATTAGCTTCGTGGCT