在scikit-learn tutorial here之后,如果我们有一个Pandas.DataFrame
,它有一个名为colors
的列,我们如何创建循环以遍历所有DataFrame的列(或包含所需列的列表),使得所有范畴变量(例如,变量colors
可以具有值blue
,red
,purple
)将由len(colors)
数虚拟变量列colors#blue
,colors#red
,colors#purple
的取代?将创建新的Pandas.DataFrame列的循环
刚刚学过python,所以我会在一些伪代码中写下我的想法。
尝试(伪代码)
cols_to_process = ['colors']
# Create new columns for dummy variables
// if listings.keyname in cols_to_process:
// unique_values = list of unique values in listings[col]
// listings = listings.join(unique_values, axis=1)
# Populate dummy variable columns
# Remove old columns that have dummy variable columns created