2017-05-03 146 views
2

我已经尝试了几种可用的解决方案,但仍无法解决此问题。因为我刚开始编程,所以它可能是一个简单的解决方案。Python - For循环

目前情况: 目前正在一个名为'dataset'的包含zscore列的Pandas数据框上工作。我想确定高于3.00的单元格,以便将zscore的值设置为3.00。另一方面,我希望zscore中的值在-3.00以下变为-3.00。

的代码:

maxzscore = 3.00 
minzscore = -3.00 

print ('Set the max zscore:', maxzscore) 
print ('Set the min zscore:', minzscore) 

for value in dataset.zscore: 
    # identify zscore above maxzscore 
    if value > maxzscore: 
     (dataset['zscore'].replace(3.00)) 
    # identify zscore below minzscore 
    elif (dataset['zscore'] < minzscore): 
     (dataset['zscore'].replace(-3.00)) 
    # do nothing 
    else: 
     pass 

    dataset.to_excel('dataset.xls') 

问题: 代码循环为环形时间,这不是非常有效的数据。因此,我想知道如何缩短处理时间并改善代码。

非常感谢帮助。

回答

6

不需要循环..只是使用clip()方法:

dataset['zscore'] = dataset['zscore'].clip(-3.0, 3.0)