2017-07-28 68 views
1

正向填充方法会覆盖原始文件中的“NA”值。 有没有什么方法可以直接处理“NA”,而不是在读取文件时将其转换为NaN?正向填充方法填充扩展行

!wget https://s3.amazonaws.com/datameetgeo/sample.txt 

import pandas as pd 
df=pd.read_csv('sample.txt', sep='\t') 
df=df.fillna(method='ffill') 

如在上面的例子中可以看出,“C-54465”的值结转下大学代码954,这是错误并且应当限于前22行。 有没有什么办法可以控制阅读过程中如何工作或者如何处理“不适用”值?

回答

2

默认pd.read_csvNA解释为空。 @shantanuo我回答你的问题,并展示了如何控制NA如何处理,而从CSV阅读你可以用参数keep_default_na=False

pd.read_csv('sample.txt', sep='\t', keep_default_na=False) 
+0

关闭这个功能。如果你有一个具体的例子,我们可以消除歧义。 – piRSquared