请帮我解析一个VCF文件。我正在粘贴一个真实的例子。 输入: 1 1014143 rs786201005 C T . . RS=786201005;RSPOS=1014143;dbSNPBuildID=144;SSR=0;SAO=1;VP=0x050068000605000002110100;GENEINFO=ISG15:9636;WGT=1;VC=SNV;PM;PMC;NSN;REF;ASP;L
我想如下修改如下程序: 第一行包含蛋白质的名称和计数随后的这种蛋白质的输出线(如N) 接下来的N行中的每一行都包含一个匹配信息:GBoxes的位置和实际匹配(记住存在扰动和X的即通配符,允许)。 脚本: import csv
import matplotlib.pyplot as plt
import numpy as np
# all G boxes
def match(x,y):
我要生成硒代半胱氨酸的标志,但是当我选择的选项与reduced_protein_alphabet我得到错误“但却难免重复字母” weblogo -f sc.txt -D fasta -o sc_logo -F pdf -a reduced_protein_alphabet -s large -n 100 -c chemistry