2015-02-17 48 views
0

如果日期完全一致,我们通常可以简单地运行df1.join(df2)。但是在我的数据集中,我与指数略有不符。熊猫在天前加入两个系列

df1pandas.tseries.index.DatetimeIndex格式2004-07-07 20:00:00, 2004-07-08 20:00:00...df2pandas.tseries.index.DatetimeIndex格式2004-07-07, 2004-07-08,...

我想忽略小时分钟和秒,加入这两个data frames。没有错误被抛出,但是NaN值将出现在df22004-07-08 20:00:00列上。我怎样才能加入这两个数据框?

回答

1

我认为最简单的解决方案是重新格式化一个或两个数据框的日期时间列。也许你可以从第一个数据框中删除时间,假设时间对你并不重要。 Here's a post which uses normalize to achieve this.

+0

真棒不知道'normalize'。解决方案很简单,'df.index = df.index.normalize()' – pyCthon 2015-02-17 23:00:35