我有一个csv文件CSV文件,如下所示:创建从另一个
19/04/2015 00:00 180 187 85 162 608 61
19/04/2015 01:00 202 20 26 70 171 61
19/04/2015 02:00 20 40 40 11 40 810
19/04/2015 03:00 20 80 81 24 0 86
19/04/2015 04:00 25 30 70 91 07 50
19/04/2015 05:00 80 611 691 70 790 37
19/04/2015 06:00 199 69 706 70 790 171
19/04/2015 07:00 80 81 90 192 57 254
19/04/2015 08:00 40 152 454 259 52 151
每一行是在该文件中的相同的小区。
我想使它看起来像这样:
19/04/2015 00:00 180
19/04/2015 00:10 187
19/04/2015 00:20 85
19/04/2015 00:30 162
19/04/2015 00:40 608
19/04/2015 00:50 61
19/04/2015 01:00 202
等。
释:
号的第一个列表是一个日期dd/M/YYYY HH:mm
有6个值,每10分钟的价值。 在第二个演示文稿中,我想知道每个值的日期和分钟的确切时间。
这是我到目前为止已经试过:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import os
import sys, getopt
import tarfile
import re
import pandas as pd
import tempfile
import shutil
import collections
import urllib
import numpy
import logging
import csv
csvFile = "testfile.csv"
data = []
minutes = ['00:00','10:00','20:00','30:00','40:00','50:00']
with open(csvFile, 'rb') as csvfile:
reader = csv.reader(csvfile, delimiter=',')
for row in reader:
row[0] = re.sub("\s+", ";", row[0].strip())
rowlist = row[0].split(';')
while(len(rowlist)<8):
rowlist.append(0)
for i in range(len(rowlist)):
for m in minutes:
data.append(rowlist[0]+rowlist[1]+m)
data.append(rowlist[i])
df = pd.DataFrame(data)
df.to_csv('example.csv')
但这代码没有给我想要的结果。 有什么建议吗?
这就是它。但我想删除第一列和第一行。怎么做? – Somar
这是一个好的开始。 OP说每10分钟的价值。我不知道如何使用'分钟[索引]'是准确的。 –
我刚做了一个编辑。即使是“熊猫”进口也没有必要。 –