正向填充方法填充扩展行

正向填充方法会覆盖原始文件中的“NA”值。有没有什么方法可以直接处理“NA”，而不是在读取文件时将其转换为NaN？正向填充方法填充扩展行

!wget https://s3.amazonaws.com/datameetgeo/sample.txt 

import pandas as pd 
df=pd.read_csv('sample.txt', sep='\t') 
df=df.fillna(method='ffill')

如在上面的例子中可以看出，“C-54465”的值结转下大学代码954，这是错误并且应当限于前22行。有没有什么办法可以控制阅读过程中如何工作或者如何处理“不适用”值？

2017-07-28 shantanuo

默认pd.read_csv将NA解释为空。 @shantanuo我回答你的问题，并展示了如何控制NA如何处理，而从CSV阅读你可以用参数keep_default_na=False

pd.read_csv('sample.txt', sep='\t', keep_default_na=False)

2017-07-28 02:26:01 piRSquared

关闭这个功能。如果你有一个具体的例子，我们可以消除歧义。 – piRSquared

回答