2016-09-17 66 views
3

我有一个从Kaggle的San Fransico工资中提取的数据框:https://www.kaggle.com/kaggle/sf-salaries 我希望创建一组列值,例如“状态”。从熊猫系列中创建一个集合

这是我尝试过的,但它带来了所有记录而不是集合的列表(sf是我如何命名数据框)。

a=set(sf['Status']) 
print a 

根据这个网页,这应该工作。 How to construct a set out of list items in python?

+0

为什么你tsay'a'是一个列表? – tacaswell

+0

也许我错误地使用了这个术语,我指的是它给了我所有来自列的值而不关心它是否是纯粹的nans –

回答

15

如果您只需要获取唯一值列表,则可以使用unique方法。 如果你想有Python的集合,然后做set(some_series)

In [1]: s = pd.Series([1, 2, 3, 1, 1, 4]) 

In [2]: s.unique() 
Out[2]: array([1, 2, 3, 4]) 

In [3]: set(s) 
Out[3]: {1, 2, 3, 4} 

但是,如果你有数据框,只需选择一系列出来的(some_data_frame['<col_name>'])。