2017-07-23 36 views
-1

我读了一个[数据集(https://outcomestat.baltimorecity.gov/Transportation/100EBaltimoreST/k7ux-mv7u/about)与pandas.read_csv()没有修改参数。计数器蟒3

  • stolenVehicleFlag列中有0,1和NaN。
  • np.nannp.NaN相比,nans返回False
  • 该列输入numpy.float64,所以我尝试将float类型的np.nans 键入,他们通常是这样,但仍然 返回False
  • 我也使用Counter滚动起来尝试,但每个楠返回上这是怎么发生的,以及如何处理它的1

    任何想法了 自己觉得呢?

+0

此外,尝试数学的nan对象和该obj转换为np.float64,仍然是False。 – user85779

+0

我想你可以检查[缺少数据](http://pandas.pydata.org/pandas-docs/stable/missing_data.html),如果需要检查'NaN's [[isnull]](http:// pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.isnull.html)函数,如'print(df ['stolenVehicleFlag']。isnull())'。 – jezrael

+0

请发布您到目前为止尝试使用的代码 – cmaher

回答

0

我不知道你期待什么可以做,但可能这会帮助,如果你想摆脱这种不同的NaN值考虑“DF”你dataframre使用:

df.dropna() 

这将帮助你与NaN值,
您可以检查更多的信息在这里:pandas.DataFrame.dropna

+0

我将列放入Counter对象以获取每个值的计数,包括查看有多少个null/nan条目。有了Counter这个列,我们可以在nan:1的对象中生成数千个单独的条目,而不是将它们转换为nan:11098。所有其他栏目都会翻阅并统计总数。 – user85779