我有以下数据集删除重复
df <- data.frame(
path = c("a,b,a",
"(direct)/(none), (direct)/(none), google/cpc, google/cpc",
"f,d",
"a,c"
)
)
,我要删除的重复,使我的输出将是
path
1: a, b
2: (direct)/(none), google/cpc
3: f, d
4: a, c
我试过,但它不工作第二行
setDT(df)
df$path <- sapply(strsplit(as.character(df$path), split=","), function(x) {
paste(unique(x), collapse = ', ')
})
你很好。尝试使用'split =“,\\ s *”'删除不需要的空格。另外,如果你打算使用'data.table',使用正确的语法来避免拷贝:'df [,path:= sapply(strsplit(as.character(df $ path),split =“,\\ s *”) ,函数(x){paste(unique(x),collapse =',')})]'。 – nicola
这是真棒@尼古拉,请考虑写下你的答案,然后我可以接受它。 – MFR
很高兴帮助。我写了一个答案。 – nicola