bioinformatics

    0热度

    1回答

    我想使用snakemake制作一个生物信息学流水线,并使用Google搜索它并阅读文档和其他内容,但是我仍然不知道如何使它工作。 这是我的一些原始数据文件。 RAWDATA/010_0_bua_1.fq.gz,RAWDATA/010_0_bua_2.fq.gz RAWDATA/11_15_ap_1.fq.gz,RAWDATA/11_15_ap_2.fq.gz ...他们都是配对的文件。) 这里是我

    0热度

    2回答

    我目前正在编写“正在做”的程序,并绘制DNA样本的相位分析,并且出现了一些问题:Output plot HERE!右侧的图像来自MATLAB并且是它应该如何看起来的例子。左边的图像是从我的程序输出的。正如你所看到的蓝色图形看起来是正确的,但它是在不同的角度。我检查过代码,它和我的程序的MATLAB版本基本相同。无论如何,我会把它放在这里,也许有一个我不知道的错误。但如果不是这样,是否有一种“转向/

    1热度

    3回答

    请帮我解析一个VCF文件。我正在粘贴一个真实的例子。 输入: 1 1014143 rs786201005 C T . . RS=786201005;RSPOS=1014143;dbSNPBuildID=144;SSR=0;SAO=1;VP=0x050068000605000002110100;GENEINFO=ISG15:9636;WGT=1;VC=SNV;PM;PMC;NSN;REF;ASP;L

    0热度

    1回答

    我有一个数据集包含DNA序列,我想将它们转换成数字表示。本文件中: 这是什么过程(转变),我想搜索一下吗? 如何在python中应用它? 它可以作为一个大数组,作为数据集输入吗?

    -1热度

    1回答

    我想分配两个文件作为输入文件。下面一个例子: directory1 AB001.txt AB002.txt AB003.txt .... directory2 AB001.fasta AB002.fasta AB003.fasta .... 所以,我要遍历超过5000 * .txt文件与相应的* .fasta文件(总是相匹配的前缀)。所有* .txt文件应该执行的命令是:

    -4热度

    1回答

    我想如下修改如下程序: 第一行包含蛋白质的名称和计数随后的这种蛋白质的输出线(如N) 接下来的N行中的每一行都包含一个匹配信息:GBoxes的位置和实际匹配(记住存在扰动和X的即通配符,允许)。 脚本: import csv import matplotlib.pyplot as plt import numpy as np # all G boxes def match(x,y):

    1热度

    2回答

    我已经看过以前提过的关于在列表中保留'for循环'输出的问题,但我似乎无法将其应用于我的函数。 也许有人可以给我一个关于我做错了什么的线索。 dna_seqs <- list('id1', 'ATGGCAATAACCCCCCGTTTCTACTTCTAGAGGAGAAAAGT', 'id2', 'TCCGTTAAGATATTCTTACGTGTGACGTAGCTATGTATTTTGCAGAGCTGGC

    1热度

    1回答

    我要生成硒代半胱氨酸的标志,但是当我选择的选项与reduced_protein_alphabet我得到错误“但却难免重复字母” weblogo -f sc.txt -D fasta -o sc_logo -F pdf -a reduced_protein_alphabet -s large -n 100 -c chemistry

    1热度

    1回答

    我是新手,尝试使用snakemake(上周左右),以便处理较少的工作流细节,以前我编写了自己的特定工作流程通过python。 我生成了一个小工作流程,其中的步骤之间将使用Illumina PE读取并运行Kraken对他们。然后,我会解析Kraken输出的输出,以检测最常见的物种(在一组允许范围内),如果没有提供物种值(使用snakemake运行-s test.snake --config R1_r

    1热度

    1回答

    我想用命令system()在R中运行shell脚本(BLAST + in NCBI),但它似乎只使用一个线程,即使我在shell脚本中设置了多个线程。在这种情况下,我应该怎么做才能使用多线程? 的代码是 system("blastp -query query.fasta -db db.fasta -num_threads 16 -outfmt \"6 qseqid sseqid pident pp