如何从索引中删除数据点

我是Python新手，我有一个包含日期的数据集S2。当我使用命令：如何从索引中删除数据点

available_datapoints = S2.index,

然后

print(available_datapoints)

产量：

<class 'pandas.tseries.index.DatetimeIndex'> 
[2017-05-07 00:00:00+00:00, ..., 2017-07-27 23:50:00+00:00] 
Length: 11808, Freq: 10T, Timezone: UTC stop

然而相反的2017-05-07 00:00:00+00:00，我要开始2017-11-07 00:00:00+00:00和替代2017-07-27 23:50:00+00:00，我想停下来2017-07-22 23:50:00+00:00 。

任何人都知道我如何改变这种情况？

来源

2017-09-13 higuys

我认为你可以使用DataFrame.truncate：

#Sample data 
S2 = pd.DataFrame({'a': range(11808)}, 
        index=pd.date_range(start='2017-05-07',periods=11808, freq='10T')) 
print (S2.head()) 
        a 
2017-05-07 00:00:00 0 
2017-05-07 00:10:00 1 
2017-05-07 00:20:00 2 
2017-05-07 00:30:00 3 
2017-05-07 00:40:00 4 

print (S2.tail()) 
         a 
2017-07-27 23:10:00 11803 
2017-07-27 23:20:00 11804 
2017-07-27 23:30:00 11805 
2017-07-27 23:40:00 11806 
2017-07-27 23:50:00 11807

S2 = S2.truncate(before='2017-07-11', after='2017-07-22 23:50:00') 
print (S2.head()) 
         a 
2017-07-11 00:00:00 9360 
2017-07-11 00:10:00 9361 
2017-07-11 00:20:00 9362 
2017-07-11 00:30:00 9363 
2017-07-11 00:40:00 9364 

print (S2.tail()) 
         a 
2017-07-22 23:10:00 11083 
2017-07-22 23:20:00 11084 
2017-07-22 23:30:00 11085 
2017-07-22 23:40:00 11086 
2017-07-22 23:50:00 11087

来源

2017-09-13 13:05:03 jezrael

假设你真的想要，而不是 '2017年11月7日' 在 '2017年7月11日' 开始（这是你的 '2017年7月23日'）结束日期后，您可以使用Partial String Indexing：

SETUP

df = pd.DataFrame(index = pd.date_range('2017-05-07 00:00:00+00:00','2017-07-27 23:50:00+00:00', freq='10T')) 
print(df.index) 

DatetimeIndex(['2017-05-07 00:00:00+00:00', '2017-05-07 00:10:00+00:00', 
       '2017-05-07 00:20:00+00:00', '2017-05-07 00:30:00+00:00', 
       '2017-05-07 00:40:00+00:00', '2017-05-07 00:50:00+00:00', 
       '2017-05-07 01:00:00+00:00', '2017-05-07 01:10:00+00:00', 
       '2017-05-07 01:20:00+00:00', '2017-05-07 01:30:00+00:00', 
       ... 
       '2017-07-27 22:20:00+00:00', '2017-07-27 22:30:00+00:00', 
       '2017-07-27 22:40:00+00:00', '2017-07-27 22:50:00+00:00', 
       '2017-07-27 23:00:00+00:00', '2017-07-27 23:10:00+00:00', 
       '2017-07-27 23:20:00+00:00', '2017-07-27 23:30:00+00:00', 
       '2017-07-27 23:40:00+00:00', '2017-07-27 23:50:00+00:00'], 
       dtype='datetime64[ns, UTC]', length=11808, freq='10T')

现在，使用部分字符串索引与切片：

df1 = df['2017-07-11':'2017-07-22 23:50:00'] 
print(df_1.index)

输出：随着时间的推移较小的数据帧之前，2017年7月11日和2017年7月22日23:50后下降：

DatetimeIndex(['2017-07-11 00:00:00+00:00', '2017-07-11 00:10:00+00:00', 
       '2017-07-11 00:20:00+00:00', '2017-07-11 00:30:00+00:00', 
       '2017-07-11 00:40:00+00:00', '2017-07-11 00:50:00+00:00', 
       '2017-07-11 01:00:00+00:00', '2017-07-11 01:10:00+00:00', 
       '2017-07-11 01:20:00+00:00', '2017-07-11 01:30:00+00:00', 
       ... 
       '2017-07-22 22:20:00+00:00', '2017-07-22 22:30:00+00:00', 
       '2017-07-22 22:40:00+00:00', '2017-07-22 22:50:00+00:00', 
       '2017-07-22 23:00:00+00:00', '2017-07-22 23:10:00+00:00', 
       '2017-07-22 23:20:00+00:00', '2017-07-22 23:30:00+00:00', 
       '2017-07-22 23:40:00+00:00', '2017-07-22 23:50:00+00:00'], 
       dtype='datetime64[ns, UTC]', length=1728, freq='10T')

来源

2017-09-13 13:06:01

如何从索引中删除数据点

回答

相关问题