2016-02-13 75 views
0

我有一个csv文件。它看起来像这样;检查python熊猫数据结构中的重复项

name,id, 
AAA,1111, 
BBB,2222, 
CCC,3333, 
DDD,2222, 

我想提取id列中的数据并放入数据结构中。为此,我使用了python熊猫。这是执行此操作的代码;

import pandas as pd 
csv_file = 'C:/test.csv' 
df = pd.read_csv(csv_file) 
column_items = df['id'] 

我想检查一下id列中的数据项是否有重复。数据项存储在column_items。在这种情况下,存在重复。

我使用Python 2.7版和熊猫库。

回答

2

要了解是否有在整列重复的ID,做

df['id'].duplicated().any() 
+0

我问一个后续问题,以找出重复的。 http://stackoverflow.com/questions/35376954/find-out-which-is-the-duplicate-in-a-python-panda-data-structure – user781486