2017-04-24 58 views
2

我有csv的另一个问题。我正在使用熊猫从csv文件中删除重复项。这样做后,我注意到所有的数据已被放入一列(预处理的数据已包含在9列)。如何避免这种情况?熊猫将一行中的所有数据放在一列

这里是数据样本:

39,43,197,311,112,88,47,36,Label_1 

下面是函数:

import pandas as pd 

def clear_duplicates(): 
    df = pd.read_csv("own_test.csv", sep="\n") 
    df.drop_duplicates(subset=None, inplace=True) 
    df.to_csv("own_test.csv", index=False) 

回答

4

删除sep,因为默认的分隔是,read_csv

def clear_duplicates(): 
    df = pd.read_csv("own_test.csv") 
    df.drop_duplicates(inplace=True) 
    df.to_csv("own_test.csv", index=False) 

也许不是那么好,但也可以工作:

pd.read_csv("own_test.csv").drop_duplicates().to_csv("own_test.csv", index=False) 
+0

对我来说这看起来不错。 – piRSquared

+0

@piRSquared - 谢谢。 – jezrael

+0

第二种选择很好! – MaxU

相关问题