2015-07-11 126 views
0

我有一个长列(excel中的9500行),其中有很多基因ID。我想删除重复项。删除列中的重复项R

ID 
BXDC2      
BXDC5     
BXDC5      
BZRPL1      
BZRPL1          
C10orf11   
C10orf116         
C10orf119    
C10orf120  
C10orf125   
C10orf125  

我希望得到的结果是:

ID 
BXDC2      
BXDC5          
BZRPL1      
C10orf11   
C10orf116         
C10orf119    
C10orf120  
C10orf125   

任何人可以帮助我的R脚本:-)?

+2

的讽刺类...删除重复是重复:) – RHertel

回答

4

您可以使用duplicatedunique。在这里,我假设列名为“ID”

df1[!duplicated(df1$ID),,drop=FALSE] 

或者

library(data.table)#v1.9.4+ 
    unique(setDT(df1), by='ID')