我从以下各列的.csv文件中读取一个数据框:Python的熊猫:多指标拆散到永远
columns = ['Year', 'month', 'column1', 'column2','column3', 'column4', 'column5', 'column6', 'column7', 'column8','Value']
数据框有116408行,但df = df.drop_duplicates()
后,它现在有98829(我不“知道为什么它在首位重复)
我要拆散它是这样的:
1 2 3 ....
2016 2017 2018 2016 2017 2018 2016 2017 2018 ....
column1 column2 .......
a1 a2 ... 24 12 20 22 15 21 12 11 13 ...
b1 b2 ... 18 11 21 21 11 31 14 41 14 ...
到目前为止,我已经试过:
df = df.set_index(columns[:-1], append=True)
df = df.unstack(level=[0,1])
但这需要永远。 (如果我删除append
一个得到这个错误:ValueError: Index contains duplicate entries, cannot reshape
)
有没有人有另一种选择或任何想法,为什么它需要这么久? 我还没有看到结果,也没有任何错误。
也许'df.to_dict(10)'和粘贴在这里输出,所以我们可以复制你的数据吗? –
我有想法。但是,我猜测。我不想花时间猜测。你可以通过提供样本数据来解决这个问题。对你的好处是你可以提高获得更高质量答案的机会。 – piRSquared
我们无法帮助您...直到看到数据.. – Wen