我在熊猫数据框中有两列。划分拆除数据帧的两列
塔1 ED和包含字符串(例如, '一', '一个', 'B,' C”, 'C', 'A')
ed column = ['a','a','b','c','c','a']
列2是作业,并且还包含字符串(例如, 'AA', 'BB', 'AA', 'AA', 'B-B', 'C-C')
job column = ['aa','bb','aa','aa','bb','cc'] #these are example values from column 2 of my pandas data frame
我然后生成一个两列的频率表是这样的:
my_counts= pdata.groupby(['ed','job']).size().unstack().fillna(0)
Now然后如何将一列中的频率除以该频率表中另一列的频率?我想采取该比例,并将其用于argsort()
,以便我可以按计算的比率进行排序,但我不知道如何引用生成的表的每列。
这是很难说这是怎么回事就没有一些数据:请尝试[包括一个小的,可复制粘贴的数据的例子](http://stackoverflow.com/questions/20109391/how-to-make-good-reproducible-pandas-examples) – Marius 2014-08-30 01:47:04