subset

    -1热度

    1回答

    我需要帮助定义一个函数,该函数在数据库中创建一个向量,其中对于每一行,函数查看该数据库中的另一列,在指定的数据库中搜索该值创建第二个数据库的一个子集,该数据库由所有匹配的行组成,并对该子集中的一个单独列进行求和,然后将该值返回到原始数据库中新列的相应行。 换句话说,我有一个看起来是这样的一个数据帧: ID <- c('a', 'b', 'c', 'd', 'e') M <- 20:39 df

    0热度

    1回答

    我有一个数据框,其值按级别(因子)分类,所以我想创建一个具有特定级别值的向量,例如, A <- c("Case1", "Case3", "Case2", "Case3", "Case2", "Case1", "Case3", "Case2", "Case2", "Case3", "Case1", "Case1", "Case3", "Case1", "Case2") Fa

    0热度

    1回答

    我对R非常陌生,正试图从一个子集中移除异常值以改善GLM。我使用的代码是: data$sel <- ifelse(data$chol==8.3 & data$whr==1.14 ,(0), (1)) data dim(data) data2 <- subset(data, !(chol==8.3 & whr==1.14)) dim(data2) 我这样做,但是,当我试图绘制新的数据图表

    1热度

    1回答

    采样中提取字符的概率我有定义了以下变量: a <- as.character(1:10) b <- 100 c <- 10 probs <- c(0.3, 0.3, 0.3, rep(0.1/7, 7)) min <- 5 max <- 10 我试图找出如何子集在下面的代码的“probs”参数与所述字符对应被随机抽样(即随机抽样字符5:10) sample(a[min:max], s

    2热度

    3回答

    对于数据表,我该如何进行动态搜索,并且只选择具有相同的Tail_No,具有不同目的地的相同Flight_ID的行。我有几百万行 的下面是表我有 My_data_table Unique_ID Tail_No Flight_ID Arrival_Airport 1AA 1234 abcd JFK 2AA 4234 bcde BWI 3AA

    1热度

    2回答

    ncvars = c("prate", "arate", "wpd", "Atm1", "Atm2", "area", "fC", bas__1", "bas__asssaa", "bas__Clow", "bas__g2333e", "baser__arge", "bas__Aow", "bas__Aass") 现在,我想删除那些 名称完全area 匹配此字符串bas__ 我怎样才能做到这一

    2热度

    1回答

    我有一个包含“pre_1,pre_2,pre_3等...”的列的数据框。我也有后标记数据为“POST1,POST2,post3 ...等)。 有没有用这个词‘前’选择所有列切片在Python数据? 感谢。

    0热度

    1回答

    我有这样的数据框,如下面的代码所示。我想要做的是打印样本1(样本1中任何样本,可以是任何样本之后)和样本2(样本2中的任何样本,之后可以是任何字母)之间最显着差异的5种蛋白质。 p值需要通过wilcoxon测试来计算。 我想对这些数据进行wilcoxon非参数检验,以计算p值,然后根据这个值计算出p值,然后用它来排序蛋白质。 我不确定如何根据样本名称对数据进行子集分类,无论接下来的字母如何,只要数

    -2热度

    2回答

    input set [1,2,3] 的所有子集 >>> a = [] >>> x = [1,2,3] >>> for t in range(1, len(x)+1): ... k = itertools.combinations(x,t) ... a.append([y for y in k]) 我获得以下输出 [ [(1), (2), (3)], [(1, 2), (1,

    0热度

    1回答

    我想检查一个数据帧(“apx”)中是否有任何行,其中来自apx中“AD”列的条目与条目匹配在另一个数据帧(“npx”)的“AD”列中,AND,其中来自匹配行的SD条目在另一个数据帧的13个单位内。 我检查过几个不同的参考,但由于我需要建立第三个数据帧(和其他原因),找不到答案。 我的工作试用这个... npx <- data.frame(TN = c(111, "Z2", 4, "fox", 3