对R来说很新颖,所以这是一个难题:我有一个从csv导入的数据框。第一列包含行名(基因),第二列包含组分配(如果基因在组1或组4等)。接下来的100列包含基因通路测量(范围-20至+20)。我想,只选择在第1组中的行,然后只对组显示的列含有至少1值1点的行大于10仅从数据帧中选择包含值大于5的列
示例数据:
NAME Group path1 path2 path3 path4 path5
gene1 8 -19.1 -26.6 3.0 0.8 -5.1
gene2 1 -2.8 22.8 -1.2 20.8 -9.6
gene3 4 -5.4 -4.0 2.7 5.8 -6.8
gene4 1 -9.9 -24.6 7.3 -2.1 -18.9
gene5 2 -4.7 -9.4 -3.1 0.6 -10.1
gene6 1 14.0 -5.8 -1.6 -2.5 -18.7
gene7 5 -6.4 -3.8 2.0 -2.1 -8.6
gene8 1 -9.9 -4.8 5.2 2.0 -17.5
我曾尝试这一方法但麻烦它适合我的数据 Subset columns in R with specific values
任何帮助将不胜感激!
这工作 - 我使用了所选列中的所有值(解决方案的第二部分)。谢谢! – user27206