的处理顺序我写一个网络爬虫是在同一时间处理多个网址,并在工作方式如下:Python的线程模块
它得到一个URL从URL列表包含在seed_list。 txt,
它抓取它并将数据写入data.txt;
就像大多数网络爬虫工作。
当我使它成为单线程时,我可以按照与seed_list.txt中的URL相同的顺序获取data.txt中的数据,但是当它是多线程时,我似乎无法控制它随着每个线程完成后将数据写入data.txt。
有没有办法让我的网络爬虫多线程,但保持原来的秩序?
非常感谢!
@Lance,伊格纳西奥和马克西姆,
谢谢大家的帮助 - 你的答案绝对点我在正确的方向。
非常感谢您指点我正确的方向。 – BananaOnTheWall 2012-04-03 04:20:01