如何可以通过np.nan
在数据帧使用以下条件替代特定的值:如果一个列的值被重复在任何后续列,比第一次出现应用np.nan
代替。如何滤除列(每行)重复值
例如,
VD_1 VD_2 VD_3 VD_4
Test Sun Test None
Sun Sun Fun Fun
Big Sand Fun Big
的结果会是这样:
VD _1 VD_2 VD_3 VD_4
None Sun Test None
None Sun None Fun
None Sand Fun Big
我应该使用drop_duplicates
和keep
等于last
?
因此,它可能有少列?您可能需要一个新的DataFrame,而不是“替换”这些值。 –
@XinHuang:是的,也可能是与无相同数量的列。查看我的更新。 – Dinosaurius
@XinHuang:请参阅我的更新。我稍微简化了它。 – Dinosaurius