最近,我正在将SAS转换为Python熊猫。我有一个问题,大熊猫在SAS中是否具有保留功能。在python熊猫中保留函数并创建一个新表格作为SAS
我的SAS代码:
data df1;
retain col3 " ";
set df;
by ID ;
if first.ID then col3=col1;
else col3=col3;
其他条件我已经是在SAS代码:
data df1;
retain col3;
set df;
by ID ;
if first.ID then col3=1;
else col3=col3+1;
如下所示 对此我试图转换
下一页SAS代码:
proc sql;
create table t1 as
select
c1, c2, c3, c4, c5, flag, max(flag) as MAX_flag
from t1
group by c1, c2, c3, c5;
run;
我在熊猫身上试过它,但看起来我犯了一些愚蠢的错误。如果有人知道如何复制sas代码块3到熊猫
t1=t1[['c1','c2','c3','c4','c5','c6']]
t1.loc[:,'Max_flag']=t1['flag'].max()
t1.groupby(['c1','c2','c3','c5'])
在我的例如。 col3是B,col1是a。 在其上它应该做的条件是 df.groupby([ 'ID'],as_index =假)。首先()
我有2列ID,A. 我的要求是输入数据DF1:
ID A
1 a
1 b
2 c
1 p
2 q
输出数据帧应该有一个列名称为B.它将按ID.first()进行分组。并将col A的数据复制到col B以获得所有分组的ID。
输出应该DF1
ID A B
1 a a
1 b a
2 c c
1 p a
2 q c
**My key requirement is to convert above SAS code to Pnadas**
能否请您提供输入和输出数据的例子吗? –
输入将像是表格10列有id列...我需要输出数据应该包含11列与我们的新列中的值,即col_1 col_2。也没有。的记录在新的数据框中也必须相同。 – user07
您能否编辑您的问题并添加示例数据?它会使它更加可读,并让其他人更好地理解你问什么。请参阅[这里](http://stackoverflow.com/questions/20109391/how-to-make-good-reproducible-pandas-examples)关于如何做得更好的建议。 –