我正在尝试合并两个没有单个密钥变量的数据集。数据看起来像这样的两组数据:合并没有密钥变量的sas数据集
study_id.....round....other variables different between the two sets
A000019....R012....etc
A000019....R013
A000047....R013
A000047....R014
A000047....R015
A000267....R014
这是我的代码...
DATA RAKAI.complete;
length study_id $ 8;
MERGE hivgps2 rccsdata;
BY study_id round;
RUN;
我试图通过study_id合并和圆形这是跨共享的只有两个变量数据集。但它只是叠加两组创建两倍的正确数量的ID。 “study_id”和“round”的组合提供了唯一的标识符,但没有一个变量。通过组合两个数据集共享的两个变量来编码新的唯一ID是否最有意义?
非常感谢
我意识到,我可以张贴我的意思是在这里处理潜在不需要的空格的代码。
DATA hivgps2;
SET hivgps2;
study_id = compress(study_id);
round= compress(round);
RUN;
DATA rccsdata;
SET rccsdata;
study_id = compress(study_id);
round=compress(round);
RUN;
通过数据看,应该有几乎完全重叠。我没有格式,数值看起来是一样的,我有这个代码在那里试图处理潜在的空间,抱歉格式混乱,我想这将是。 DATA hivgps2; SET hivgps2; study_id = compress(study_id); round = compress(round); RUN; DATA rccsdata; SET rccsdata; study_id = compress(study_id); round = compress(round); RUN; – jkh107
甜蜜的耶稣汤姆它工作!我需要研究清洁代码,所以下次我可以做,非常感谢 – jkh107