我想在特定列的proc sql
语句中使用select distinct
。我有大约10列,我不想检查整个10列的重复,我只想检查一列的重复。尝试在特定列的Proc Sql语句中选择不同
所以,当我写的proc sql
像下面,select distinct
检查过所有10列的重复:
proc sql;
create table newtable as
select distinct Col1, Col2, Col3, Col4, ... , Col10 from oldtable;
quit;
我试着写类似下面检查重复仅为COL3,太添加其他列进入新表格。但它失败了。我也尝试过不同的组合,例如在from oldtable
之后添加新的select distinct Col3
,但所有组合均失败。那么诀窍是什么?
proc sql;
create table newtable as
select (distinct Col3), * from oldtable;
quit;
问题是我从前面的左连接过程中得到了“重复”,这意味着输入表就像1000行,而输出表就像1100行。我期望输出表格也是1000行,但显然有些行在左连接后保存了两次(这就是我称之为重复的原因)。 我只想根据只有一列删除下一步中的重复行。 – user3714330
听起来像你需要修复左连接过程。 – Joe
,我试图在左连接过程的前一步中实现'select distinct',但它不起作用。 但是我会检查'group by',如果它可以帮助我在LEFT加入过程中 – user3714330