我有一个脚本,它将销售值写入文件中的单独行,最终目标是将数据保存到数据库中。我遇到的问题是,对于同一销售人员,日期,产品,价格和数量有重复的条目。查找重复项,添加到变量并删除
我的代码是这样写的文件:
John 07-15-2016 Tool Belt $100 2
Sara 07-15-2016 Hammer $100 3
John 07-15-2016 Tool Belt $100 2
John 07-15-2016 Tool Belt $100 2
Sara 07-15-2016 Hammer $100 3
如何删除重复项,并添加在一起?即输出为:
John 07-15-2016 Tool Belt $100 6
Sara 07-15-2016 Hammer $100 6
我用计数器,但它不赶多个实例,我也不能找到一种方法,添加两个在一起。
任何帮助,将不胜感激。
脚本:
for line in s:
var = re.compile(r'(\$)',re.M)
line = re.sub(var, "", line)
var = re.compile(r'(\,)',re.M)
line = re.sub(var, "", line)
line = line.rstrip('\n')
line = line.split("|")
if line[0] != '':
salesperson = str(salesperson)
date = dt.now()
t = line[0].split()
print t
t = str(t[0])
try:
s = dt.strptime(t, "%H:%M:%S")
except:
s = dt.strptime(t, "%H:%M")
s = s.time()
date = dt.combine(date, s)
date = str(date)
price = line[1]
quantity = line[2]
fn.write("%s %s %s %s \n" % (salesperson, date, price, quantity))
fn.close()
你是怎么写这个文件的?显示您的脚本的相关部分 – Gocht
@Gocht我编辑它以显示脚本 – Dorian
您可以创建一个字典,以便在读取文件时跟踪值,并且只有在完成处理数据后才写入。一路书写不允许你有效地回溯。 – Hobbes