是否有可能遍历dask GroupBy对象以访问基础数据框?我想:遍历dask中的GroupBy对象
import dask.dataframe as dd
import pandas as pd
pdf = pd.DataFrame({'A':[1,2,3,4,5], 'B':['1','1','a','a','a']})
ddf = dd.from_pandas(pdf, npartitions = 3)
groups = ddf.groupby('B')
for name, df in groups:
print(name)
然而,这将导致一个错误:KeyError: 'Column not found: 0'
更广泛地说,什么样的互动也将DASK的GroupBy对象允许,除了从适用的方法?
我很高兴地发现get_group()方法已经实现。 –
你的代码适合我, –
@StevenG感谢您的反馈。也许有一个问题,我的设置 –