检查大向量中的每个值是否在其他大向量中

我有一个约800K ID的向量，并且我想检查它是否是其他两个大向量之一的“主动”和“取消”约100万条记录。我怎样才能做到这一点？显然，循环使用800K的Ids，并在“有效”和“取消”向量中进行％检查将花费很长时间...有更快的方法吗？检查大向量中的每个值是否在其他大向量中

我的目标是有名单的每一个800K的ID，如果他们是活跃或取消，并获得somethign像下面这样：

ID Active Cancelled 
123  1   0 
124  1   0 
...

2016-01-20 L Xandor

我们可以试试'+（df1 $％％vec1中的活动％）'如果这些是字符向量，你可以使用'％chin％'' data.table' – akrun

您提到您正在为每个ID单独循环。目前还不清楚为什么这是必要的。如果您可以提供预期输出的小型可重复示例，那将会很有帮助 – akrun

，如果你正在处理的载体，你应该给intersect功能镜头......基本上只是一个包裹的%in%但不过......

2016-01-20 13:13:46 WD11

回答