0
我有数据与人名和他们的ID号列表。并非所有具有相同名称的人都有相同的ID号码,但名称不同的每个人都应具有不同的ID号。像这样:R ID错误检查(不同的名称,相同的ID)
Name david david john john john john megan bill barbara chris chris
ID 1 1 2 2 2 3 4 5 6 7 8
我需要确保这些ID是正确的。因此,我想编写一个代码,只有在ID号相同但名称不同的情况下才显示为“子集”(所以我将仅对ID错误进行子集化)。我甚至不知道从哪里开始的这一点,因为我试过
df1<-df(subset(duplicated(df$Name) & duplicated(df$ID)))
Error in subset.default(duplicated(df$officer) & duplicated(df$ID)) :
argument "subset" is missing, with no default
,但它没有工作,我知道这并不让R能够匹配和比较姓名和身份证号码。
非常感谢你提前。
你是对的!我搞乱了子集命令,但是我写下的命令并没有完全按照我想要的那样去做。当我运行该命令时,它给了我整个数据集 - 不仅仅是具有不同名称和相同ID号的数据集。 :( – Rachel
对不起,我正在努力格式化数据以匹配本网站的格式!!!!上面的例子我很好 - 如果我的子集,结果应该是0意见。如果约翰的ID是3和Chris的ID也是3,然后它就成了一个问题,我需要知道在我的数据集中有多少人(名字不同但姓名相同的人)(我发现了一对夫妇,在数据) – Rachel
是的!!!它的工作!非常感谢你!你是非常聪明! – Rachel