我很难正确计算月份。到目前为止,我所得到的结果都低于输出结果。 虽然大部分月份计算正确,但有些则没有。我需要弄明白这一点,因为它在扰乱我。 任何想法,不胜感激。使用熊猫和numpy计算月份
import pandas as pd
import numpy as np
df = pd.DataFrame({
'StartDate' : ['2017-06-19', '2017-10-01', '2017-09-29', '2017-08-01', '2017-08-01'],
'EndDate' : ['2018-06-18', '2017-12-31', '2018-09-30', '2018-07-31', '2017-09-30'],
'ExpectedMonths' : [13, 3, 13, 12, 2]
})
df['StartDate'] = pd.to_datetime(df['StartDate'], format='%Y-%m-%d')
df['EndDate'] = pd.to_datetime(df['EndDate'], format='%Y-%m-%d')
df['calculatedMonths'] = (df["EndDate"] - df["StartDate"])/np.timedelta64(1, 'M')
df['ceilMonths'] = df['calculatedMonths'].apply(np.ceil)
输出至今: 正如你可以看到,第一行应该是13,但我看到的结果12。六月到五月是12,并添加另一个月(6月),应该是13
EndDate ExpectedMonths StartDate calculatedMonths ceilMonths
0 2018-06-18 13 2017-06-19 11.959178 12.0
1 2017-12-31 3 2017-10-01 2.989794 3.0
2 2018-09-30 13 2017-09-29 12.024888 13.0
3 2018-07-31 12 2017-08-01 11.959178 12.0
4 2017-09-30 2 2017-08-01 1.971293 2.0
我需要什么,以获得预期的输出和计算的月相匹配调整?