2016-01-20 63 views
0

我有一个约800K ID的向量,并且我想检查它是否是其他两个大向量之一的“主动”和“取消”约100万条记录。我怎样才能做到这一点?显然,循环使用800K的Ids,并在“有效”和“取消”向量中进行%检查将花费很长时间...有更快的方法吗?检查大向量中的每个值是否在其他大向量中

我的目标是有名单的每一个800K的ID,如果他们是活跃或取消,并获得somethign像下面这样:

ID Active Cancelled 
123  1   0 
124  1   0 
... 
+0

我们可以试试'+(df1 $%%vec1中的活动%)'如果这些是字符向量,你可以使用'%chin%'' data.table' – akrun

+0

您提到您正在为每个ID单独循环。目前还不清楚为什么这是必要的。如果您可以提供预期输出的小型可重复示例,那将会很有帮助 – akrun

回答

0

,如果你正在处理的载体,你应该给intersect功能镜头......基本上只是一个包裹的%in%但不过......