这是我一直试图通过这几天的项目。我们正在寻找更好的方法来将财务数据整合到我们的仪表板中,但是我们使用的软件以令人厌恶的方式输出我们的数据,这种方式无法插入任何类型的程序,因为它可以让人们直观地浏览并获得想法。熊猫 - 按列分列我的数据框成行
我希望得到关于如何正确编写代码的建议,但是如果我在解决它的方法上疯了。这个数据已经被大量清除,所以请让我知道如果有什么可怕的错误:
Expense Categories Jan Actual Jan Budget Feb Actual \
3 5600 Direct Personnel Expenses 2521.73 0 -290.57
4 6000 Automobile Expense 909.33 1314 483.15
5 6160 Funeral Home Expense 1072 1800.02 0
6 6400 Lab Expense 0 0 65.18
9 6100 Marketing & Promotion 543.13 1850.01 1158.41
同时,在清洗我把变量,如:
department = "PR"
direct_indirect = {'5600 Direct Personnel Expenses' : 'Direct Expense', etc}
我的最终目标是包括在仪表盘预算概要我设计的通过画面每一个部门,所以我相信最好的结局会是这样的:
Expense Category Direct/Indirect Department Month-Year Actual Budget
6400 Lab Expense Direct Expense PR jan 2016 0 0
6400 Lab Expense Direct Expense PR feb 2016 0 0
6400 Lab Expense Direct Expense PR mar 2016 0 0
6400 Lab Expense Direct Expense PR apr 2016 0 0
6400 Lab Expense Direct Expense PR may 2016 0 0
当我奋力如何完成这个我我完全不确定如何通过在每个费用类型的新数据框中创建多行来实现,并且每两列都是一组新的数字。我觉得唯一的办法是使用:
for index, row in df1.iterrows():
但我会如何遍历每个列,然后分配给那些新的数据帧丢失。
请让我知道,如果我想念你需要的任何细节,我感谢你的帮助。
安迪
我想你想看看multiindexing。你可以通过聪明的枢轴等获得很多你想要的东西。 – Keith