TL; DR如何编写长熊猫聚合?
怎么写,涉及像groupby()
,unstack()
或apply()
以及许多操作长聚合?
例
说你有n_events = 10
不同事件DataFrame()
与n_sales = 1000
售票,像
,你想在多少事件至少n = [50, 100]
门票在出售积晚上:
然后我会去做
accumulation_of_sales = sales.groupby(['Time', 'Event']).size().unstack().fillna(0).cumsum()
events_with_n_sales = accumulation_of_sales.apply(lambda x: x.value_counts(), axis=1).fillna(0)
events_with_geq_n_sales = events_with_n_sales[events_with_n_sales.columns[::-1]].cumsum(axis=1)
events_with_geq_n_sales[n].plot()
这似乎很难读,我和线条原则太长(见PEP)。所以,
- 这个特定的和类似的操作如何做得最好?
- 是否有一些教程/风格指南/ ...为初学者?也许不是特别是熊猫,但类似的语言?
如果你想知道为什么我会想这样做:我需要为已读出的随机模型比较与整数实验数据。所以这是随着时间的推移可能产生的堆积直方图。 – qiv