2016-08-02 152 views
2

我有数据帧看看喜欢这样的:大熊猫的时间序列数据预处理

> dt 
    text timestamp 
0 a 2016-06-13 18:00 
1 b 2016-06-20 14:08 
2 c 2016-07-01 07:41 
3 d 2016-07-11 19:07 
4 e 2016-08-01 16:00 

我想每个月的数据总结,如:

> dt_month 
count timestamp 
0 2 2016-06 
1 2 2016-07 
2 1 2016-08 

原始数据集(dt)可以通过生成:

import pandas as pd 
data = {'text': ['a', 'b', 'c', 'd', 'e'], 
    'timestamp': ['2016-06-13 18:00', '2016-06-20 14:08', '2016-07-01 07:41', '2016-07-11 19:07', '2016-08-01 16:00']} 
dt = pd.DataFrame(data) 

有没有什么方法可以绘出时间频率图dt_month

回答

1

您可以通过timestamp列GROUPBY转换to_period和聚集size

print (df.text.groupby(df.timestamp.dt.to_period('m')) 
       .size() 
       .rename('count') 
       .reset_index()) 

    timestamp count 
0 2016-06  2 
1 2016-07  2 
2 2016-08  1