我有一个huuge csv文件(524 MB,记事本打开它4分钟),我需要更改格式。现在是这样的:转换一个巨大的txt文件
1315922016 5.800000000000 1.000000000000 1315922024 5.830000000000 3.000000000000 1315922029 5.900000000000 1.000000000000 1315922034 6.000000000000 20.000000000000 1315924373 5.950000000000 12.452100000000
该行由一个换行符符号划分,当我把它粘贴到Excel中把它分成线。我会通过使用Excel函数来完成它,但文件太大而无法打开。 第一个值是自1-01-1970以来的秒数,第二个是价格,第三个是volumen。
我需要它是这样的:
01-01-2009 13:55:59 5.800000000000 1.000000000000 01-01-2009 13:56:00 5.830000000000 3.000000000000
等
记录需要用空格分开。有时来自同一第二价格的多个值是这样的:
1328031552 6.100000000000 2.000000000000
1328031553 6.110000000000 0.342951630000
1328031553 6.110000000000 0.527604200000
1328031553 6.110000000000 0.876088370000
1328031553 6.110000000000 0.971026920000
1328031553 6.100000000000 0.965781090000
1328031589 6.150000000000 0.918752490000
1328031589 6.150000000000 0.940974100000
发生这种情况时,我需要代码从该秒开始取平均价格,并且每秒只节省一个价格。 这些比特币交易在BTC开始时并不会每秒发生。 当某些秒没有记录时,需要创建一个新记录,其中包含以下第二个记录,以及从最后一个已知价格和volumen中复制的价格和智能体的值。
然后将所有内容保存到新的txt文件中。
我似乎无法做到这一点,我一直在尝试在python中编写一个转换器几个小时,请帮助。
你到目前为止尝试过什么?你能向我们展示一些你的代码,所以我们可以看到我们可以帮助的地方吗? – serk
没有什么我试过让我甚至完成了10%的工作,所以我什么都没有。 –
请你解释一下'01-01-2009 13:55:59 1586.12 220000 01-01-2009 13:56:00 1586.12 220000'是从输入中导出的吗? –