我有一个大的文件(1.6演出)与分隔的列表:啜食/ CSV /环路中的文件创建数百万有列行的字典
[||]
我曾尝试使用csv模块但它说我只能用一个字符作为分隔符。所以这里是我有:
fileHandle = open('test.txt', 'r', encoding="UTF-16")
thelist = []
for line in fileHandle:
fields = line.split('[||]')
therow = {
'dea_reg_nbr':fields[0],
'bus_actvty_cd':fields[1],
'drug_schd':fields[3],
#50 more columns like this
}
thelist.append(therow)
fileHandle.close()
#now I have thelist which is what I want
和繁荣,现在我有一个字典的名单,它的作品。我想要一个清单,因为我关心订单,而字典是因为它是预期的下游。这只是感觉像我应该利用更有效的东西。我认为这不会超过一百万行和这么多的数据。所以,我的问题如下:
以多字符分隔文本文件(UTF-16编码)和创建字典列表的更有效方式是什么?
任何想法,将不胜感激!
就这么你知道,字典是在python 3.6中订购的;) – Y0da
一个明显的改进是使用'generator'和'yield'行而不是使用'list',但这不是一个可行的改进,如果你真的需要输出作为'list'。 –
这可能是开始与大熊猫合作的好日子。 – Igor