我有一个数据框与多列其中之一是日期列。目前该列中的数据采用以下格式:2012年2月1日9:30Python,熊猫分裂成两列
但是,我想将其分成两个单独的列,日期:2012年2月1日和时间:9:30
我已经找到了以下解决方案:
df = pd.DataFrame(df.date.str.split(' ',1).tolist(), columns = ['date','time'])
但是这将创建只包含两个新的分割列,而不是其他人,以及一个新的数据帧。
有没有办法在不创建新数据框的情况下拆分现有数据框的列?
什么是解决这个问题的计算最有效的方法? (我处理的数据集包含约20百万行)
有一天......我会记得使用'pop' – piRSquared
这个工作,但是当我运行它时,我的物理内存使用量猛增到几乎100%,但我想这只是因为数据集是巨大的。 –