我目前正在使用从Excel导入的数据框。数据帧的头看起来是这样的:分别循环遍历数据帧的每一列
CRED ACBA PAYMS PUR
0 0 2 2 2
1 0 4 2 2
2 0 1 2 3
3 1 1 2 2
4 0 2 4 3
我再这个数据帧到一个较小的数据帧进行时CRED = 1
df_CRED1 = df_original[df_original.CRED == 1]
我采用下列操作栏“木神”
list_frequency_cred1 = [df_CRED1['ACBA'].value_counts()]
frequency_cred1_total = sum(df_CRED1['ACBA'].value_counts())
matrix_frequency_cred1 = DataFrame(data = list_frequency_cred1)
matrix_frequency_cred1['Total'] = frequency_cred1_total
matrix_frequency_cred1.rename(index = {'ACBA':'CRED1'}, inplace=True)
为了获得下表:
1 2 3 4 Total
CRED1 9 11 1 7 28
我现在正在创建一个循环,将适用于以获得单独的频率表对每列我做了列ACBA所有其他列这样的操作顺序:
ACBA
1 2 3 4 Total
CRED1 9 11 1 7 28
PAYMS
1 2 3 4 Total
CRED1 4 5 6 7 22
etc...
我不明白如何设置循环以便分别考虑每列。后来在我的代码中,我将不得不将其他操作应用于相同的数据框,所以我想了解基础逻辑(而不是查找与频率相关的函数)。谢谢
是,我肯定会在某个时候优化它。谢谢你的回答,它的工作! – Dine