熊猫将一行中的所有数据放在一列

我有csv的另一个问题。我正在使用熊猫从csv文件中删除重复项。这样做后，我注意到所有的数据已被放入一列（预处理的数据已包含在9列）。如何避免这种情况？熊猫将一行中的所有数据放在一列

这里是数据样本：

39,43,197,311,112,88,47,36,Label_1

下面是函数：

import pandas as pd 

def clear_duplicates(): 
    df = pd.read_csv("own_test.csv", sep="\n") 
    df.drop_duplicates(subset=None, inplace=True) 
    df.to_csv("own_test.csv", index=False)

来源

2017-04-24 Timofey Goritsky

删除sep，因为默认的分隔是,在read_csv：

def clear_duplicates(): 
    df = pd.read_csv("own_test.csv") 
    df.drop_duplicates(inplace=True) 
    df.to_csv("own_test.csv", index=False)

也许不是那么好，但也可以工作：

pd.read_csv("own_test.csv").drop_duplicates().to_csv("own_test.csv", index=False)

来源

2017-04-24 13:02:35 jezrael

对我来说这看起来不错。 – piRSquared

@piRSquared - 谢谢。 – jezrael

第二种选择很好！ – MaxU

熊猫将一行中的所有数据放在一列

回答

相关问题