0
我有一个约800K ID的向量,并且我想检查它是否是其他两个大向量之一的“主动”和“取消”约100万条记录。我怎样才能做到这一点?显然,循环使用800K的Ids,并在“有效”和“取消”向量中进行%检查将花费很长时间...有更快的方法吗?检查大向量中的每个值是否在其他大向量中
我的目标是有名单的每一个800K的ID,如果他们是活跃或取消,并获得somethign像下面这样:
ID Active Cancelled
123 1 0
124 1 0
...
我们可以试试'+(df1 $%%vec1中的活动%)'如果这些是字符向量,你可以使用'%chin%'' data.table' – akrun
您提到您正在为每个ID单独循环。目前还不清楚为什么这是必要的。如果您可以提供预期输出的小型可重复示例,那将会很有帮助 – akrun