genetics

    5热度

    4回答

    我有一个300 GB的文本文件,其中包含超过250k条记录的基因组数据。有一些记录数据不好,我们的基因组计划'Popoolution'允许我们用星号评出“坏”记录。我们的问题是,我们找不到一个文本编辑器来加载数据,以便我们可以将不良记录注释掉。有什么建议么?我们同时拥有Windows和Linux机器。 UPDATE:更多信息 当达到“不良”记录给我们的行号,我们就可以注释掉程序Popoolutio

    3热度

    2回答

    我在这里发表问题:Matched Range Merge in R有关合并在一个文件中落入一个范围在第二个文件基于多项两个文件。到目前为止,我还没有成功将代码拼凑在一起来实现这一点。我遇到的问题是我正在使用的代码逐行比较文件。这是一个问题,因为1)一个文件比另一个文件长得多,并且2)我需要较短文件中的行扫描长文件中的每个范围对 - 不仅仅是同一行中的范围。 我一直在使用原始问题中发布的函数,我觉得

    1热度

    1回答

    我正在编写一个处理基因序列的程序,我想将每个核苷酸存储在一个字节中,其中每个位代表基因字母表中的一个字母A,C,G,T(只有一半这些位将被明显地使用)。 我的编码如下: A = 0b1000 C = 0b0100 G = 0b0010 T = 0b0001 R = 0b1010 Y = 0b0101 N = 0b0000 这里,R是嘌呤,它可以代表A或G,Y是嘧啶(C或T)和N可以

    0热度

    1回答

    我试图找到一种方法,使用距离加权判别法(DWD)从多个微阵列数据删除的偏见。 我的出发点是this。问题是,matlab版只能在Windows下运行,需要练成5格式输入(如数据出现在65535线被截断 - MATLAB的错误是: Error reading record for cells starting at column 65535. Try saving as Excel 98. )。

    3热度

    2回答

    所以我需要制作一个程序,用一个单一的基因产生一代理论生物体的随机同样适合的等位基因。 我开始与包含一个突变等位基因2列表,然后我选择3个等位基因为下一代,并把它们添加到列表中,为下一代 import random p = [1,1,1,2] from random import choice n=len(p)-1 for i an range(n): p.append(ch

    315热度

    4回答

    我试图表示一个简化的染色体,它由N个碱基组成,每个碱基只能是{A, C, T, G}之一。 我想用enum正式确定约束条件,但是我想知道在Go中模拟枚举最常用的方法是什么。

    0热度

    2回答

    我有两个表,每个的开始如下: 表1:所有SNP SNp Gene rs1798922 ENSG00000167634 rs4677723 ENSG00000167634 rs1609823 ENSG00000104450 rs11597390 ENSG00000104643 rs7824557 ENSG00000104643 rs1371867 ENSG00000104450

    0热度

    1回答

    我是R新手,需要处理此问题的建议: 我有2个表。表的开始如下所示: 表1: SNP Gene Pval Best_SNP Best_Pval rs2932538 ENSG00000007341 5.6007 rs10488631 ENSG00000064419 7.7461 rs12537284 ENSG00000064419 4.5544 rs3764650 ENSG000000

    2热度

    1回答

    的条件插入我有一个独特的数据集,其中一部分可利用被再现: data <- textConnection("SNP_Pres,Chr_N,BP_A1F,A1_Beta,A2_SE,ForSortSNP,SortOrder rs122,13,100461219,C,T,rs122,6 1,16362,0.8701,-0.0048,0.0056,rs122,7 1,19509,0.54601513

    3热度

    1回答

    我有 WGCNA以下问题 - http://labs.genetics.ucla.edu/horvath/htdocs/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/ 工作的第1.6节,网络外部软件出口(的Cytoscape) 我目前正试图执行关于一组基因的WGCNA,我无法获得每个模块的顶部x中心基因。我正在尝试将网络导出到Cytoscape,并使用