2016-02-29 187 views
0

我的数据框有一个名为dir的列,它有几个值,我想知道有多少值通过某个点。例如:熊猫:选择大于值

df['dir'].value_counts().sort_index() 

它返回一个Series

0  855 
20  881 
40  2786 
70  3777 
90  3964 
100  4 
110 2115 
130 3040 
140  1 
160 1697 
180 1734 
190  3 
200  618 
210  3 
220 1451 
250  895 
270 2167 
280  1 
290 1643 
300  1 
310 1894 
330  1 
340  965 
350  1 
Name: dir, dtype: int64 

在这里,我想知道通过500在这种情况下,值的数量,这一切都只是100,140,190210,280300330350。

我该怎么做?

我可以逃脱df['dir'].value_counts()[df['dir'].value_counts() > 500]

回答

1
(df['dir'].value_counts() > 500).sum() 

这得到了价值数和返回他们为一系列真值。这些parens把这件事看作一系列的东西。 .sum()将True值计为1,将False值计为0.