我有两个数据集(d1和d2),我想根据个别特定标识符(ind_ID)进行合并。问题是有些情况下,一个或两个数据集中出现两次相同的ind_ID(其他字段不同)。SAS合并重复观察
我在d1中选择一个重复项以合并两个重复项在d2中,但我不确定如何告诉SAS只选择d1中的一个观察值并将它合并到d2中。我是这样做的,因为我还没有被告知哪个观察结果是正确的,我希望继续我的编码,直到信息进入。
到目前为止,我尝试了基于合并贷款编号(第一个示例代码)以及使用合并标识符(第二个示例代码)。似乎两者都有相同的结果,并且SAS只是随机选择重复项中的哪个ind_ID与哪个重复项合并。
缺少手动检查数据和删除不想合并的观察值,有没有办法做到这一点?
data merge_test;
merge d1 d2;
by ind_ID;
run;
data merge12;
merge d1(in=a) d2(in=b);
by ind_ID;
if a and b;
mergecheck = compress(a||b);
run;