2016-02-29 94 views
0

我在下面的视图中有一个数据集,并希望根据数据可用性和不同的匹配将一个唯一的id分配给一组记录变量。根据sas中多个变量的查找值为一组记录分配一个唯一的标识

"Policy No" "Previous Policy No" "Next policy No" 
101 55 110 
110 101 201 
220 110 
511  532 
532 511 

预期的数据集:

"Customer Id" "Policy No" "Previous Policy No" "Next policy No" 
1 101 55 110 
1 110 101 201 
1 220 110 
2 511  532 
2 532 511 
+0

有点混乱。你能不能展示你所尝试过的,并模拟出令人满意的结果?请使用Ctl + K格式化代码并用逗号分隔列名或将它们放在引号中。 –

+0

我相信这通常被称为链接查找问题。这里有一个解决方案,但你的想法稍微复杂一点,http://support.sas.com/kb/25/029.html – Reeza

+0

@Reeza ..多数民众赞成在解决方案,我在看..谢谢链接 – user3738411

回答

0

我不明白你的问题,但你可以通过使用MD5,并给它形成的关键变量生成一个唯一的ID。

例如:

data want; 
ID = PUT(MD5(CATS("Var1","Var2")),$HEX32.); 
PUT ID; 
RUN; 

结果:5BC449EDA5CF2BA878ABE53CB3955D38

该ID将是唯一的。您只需要决定您的业务密钥并将其提供给MD5。做一些数据清理,例如,如果您的密钥在大小写不同的情况下可以提供所有变量,但不具有意义。

相关问题