2017-08-14 47 views
0

我正在寻找熊猫语法来完成以下聚合到Pandas DataFrame。我无法找到一个例子来说明如何在pandas中完成以下sql查询。用于更复杂的sql查询的pandas语法

#sum and divide 
select 
click, 
ctr, 
SUM(click)/SUM(imp) as ctr 
from mytable 
group by website 

#normalize each subgroup 
select 
imp, 
imp/SUM(imp) Over (partition website) as n_imp 
from mytable 
+0

请提供样本数据集和所希望的数据集 – MaxU

+0

IMO第一SQL是erronous如'click'和'ctr'不在按条款分组 – MaxU

回答

1

SQL:

#normalize each subgroup 
select 
imp, 
imp/SUM(imp) Over (partition website) as n_imp 
from mytable 

熊猫:

df[['website','imp']].assign(n_imp=df['imp']/df.groupby('website')['imp'].transform('sum')) 
0

大熊猫具有功能read_sql,让你在写SQL查询和结果拉成数据帧的。