我目前文件正在与超过200万线。我已将行分隔为元素列表(例如:[a,b,c,d]
= 1行,单词分隔)。Python的循环优化
我尝试使用下面的代码要经过所有行:
for a in aud:
for esps in final:
if a[0] in final[esps]:
a[0] = esps
在第一个for循环,我指的是200万条+线。在第二个for循环中,它通过一个带有2010键的字典,每个键可能至少有50个相应的值。我想在等于字典中的值的行中找到a[0]
元素。如果它们匹配,则将所选行中的a[0]
元素更改为字典的键值。
的问题是,这种代码需要年龄运行,我不明白太多(没有),有关优化,以及如何以更快的速度运行此。 如果有人能告诉我如何更快地做这样的事情,我会非常感谢。
嗯,你只限于一台电脑?我想你可以用几个工人来做到这一点。即使只使用一台计算机,也可以使用多核CPU创建多个工作人员 –
在没有任何示例数据的情况下,要解决您的实际问题有点难。每个“最终”字典字符串中的所有50个密钥都是? – jsbueno
在迭代它的时候会不会有一个变异对象的副作用? – pylang