subset

-1热度

1回答

我需要帮助定义一个函数，该函数在数据库中创建一个向量，其中对于每一行，函数查看该数据库中的另一列，在指定的数据库中搜索该值创建第二个数据库的一个子集，该数据库由所有匹配的行组成，并对该子集中的一个单独列进行求和，然后将该值返回到原始数据库中新列的相应行。换句话说，我有一个看起来是这样的一个数据帧： ID <- c('a', 'b', 'c', 'd', 'e') M <- 20:39 df

0热度

1回答

如何使用按R中因子分类的数据框的值创建矢量？

我有一个数据框，其值按级别（因子）分类，所以我想创建一个具有特定级别值的向量，例如， A <- c("Case1", "Case3", "Case2", "Case3", "Case2", "Case1", "Case3", "Case2", "Case2", "Case3", "Case1", "Case1", "Case3", "Case1", "Case2") Fa

0热度

1回答

如何从R子集中删除异常值？

我对R非常陌生，正试图从一个子集中移除异常值以改善GLM。我使用的代码是： data$sel <- ifelse(data$chol==8.3 & data$whr==1.14 ,(0), (1)) data dim(data) data2 <- subset(data, !(chol==8.3 & whr==1.14)) dim(data2) 我这样做，但是，当我试图绘制新的数据图表

1热度

1回答

该随机R中

采样中提取字符的概率我有定义了以下变量： a <- as.character(1:10) b <- 100 c <- 10 probs <- c(0.3, 0.3, 0.3, rep(0.1/7, 7)) min <- 5 max <- 10 我试图找出如何子集在下面的代码的“probs”参数与所述字符对应被随机抽样（即随机抽样字符5:10） sample(a[min:max], s

2热度

3回答

r中的动态迭代

对于数据表，我该如何进行动态搜索，并且只选择具有相同的Tail_No，具有不同目的地的相同Flight_ID的行。我有几百万行的下面是表我有 My_data_table Unique_ID Tail_No Flight_ID Arrival_Airport 1AA 1234 abcd JFK 2AA 4234 bcde BWI 3AA

1热度

2回答

如何从符合模式的矢量中删除所有元素？

ncvars = c("prate", "arate", "wpd", "Atm1", "Atm2", "area", "fC", bas__1", "bas__asssaa", "bas__Clow", "bas__g2333e", "baser__arge", "bas__Aow", "bas__Aass") 现在，我想删除那些名称完全area 匹配此字符串bas__ 我怎样才能做到这一

2热度

1回答

按列名称设置数据框

我有一个包含“pre_1，pre_2，pre_3等...”的列的数据框。我也有后标记数据为“POST1，POST2，post3 ...等）。有没有用这个词‘前’选择所有列切片在Python数据？感谢。

0热度

1回答

基于列名和计算p值的R子设置

我有这样的数据框，如下面的代码所示。我想要做的是打印样本1（样本1中任何样本，可以是任何样本之后）和样本2（样本2中的任何样本，之后可以是任何字母）之间最显着差异的5种蛋白质。 p值需要通过wilcoxon测试来计算。我想对这些数据进行wilcoxon非参数检验，以计算p值，然后根据这个值计算出p值，然后用它来排序蛋白质。我不确定如何根据样本名称对数据进行子集分类，无论接下来的字母如何，只要数

-2热度

2回答

蟒蛇 - 与我们得到这个程序的输出如下itertools.combinations一套

input set [1,2,3] 的所有子集 >>> a = [] >>> x = [1,2,3] >>> for t in range(1, len(x)+1): ... k = itertools.combinations(x,t) ... a.append([y for y in k]) 我获得以下输出 [ [(1), (2), (3)], [(1, 2), (1,

0热度

1回答

根据多个选择条件匹配的两个不同数据框中的行建立第三个数据帧

我想检查一个数据帧（“apx”）中是否有任何行，其中来自apx中“AD”列的条目与条目匹配在另一个数据帧（“npx”）的“AD”列中，AND，其中来自匹配行的SD条目在另一个数据帧的13个单位内。我检查过几个不同的参考，但由于我需要建立第三个数据帧（和其他原因），找不到答案。我的工作试用这个... npx <- data.frame(TN = c(111, "Z2", 4, "fox", 3