所以,我在发布这篇文章之前回顾了大量的文章和论坛,但是我一直在阅读冲突的答案。首先,操作系统不是问题,我可以使用Windows或Unix,无论对我的问题最好。我有大量的数据需要用于只读目的(不知道为什么这很重要,但是,如果是这样,我将不得不经历的数据结构是一组数组哈希值的数组也是数组)。我基本上将一个“查询”与大量不同的“句子”进行比较,并计算它们的相对相似性。从这些数量(几百万)中,我想获得最高的x%,并与他们一起做些事情。我需要将这个过程并行化。对于我来说,减少空间没有什么好的方法 - 我需要比较一切以获得好的结果,而且它会花费太长的时间来处理某些线程/分支。我再次看到许多相互矛盾的答案,不知道该怎么做。Threading vs Forking(解释我想做什么)
任何帮助,将不胜感激。提前致谢。
编辑:我不认为内存使用量将是一个问题,但我不知道(8 GB RAM)
的Perl吃比预期更多的内存。在你走之前,试着加载你的数据结构,看看会花多少钱,结果可能让你感到惊讶。 – 2013-04-28 00:57:12
我在这里没有看到问题。 – jordanm 2013-04-28 01:16:20
问题是,我应该使用什么:线程或分叉? – 2013-04-28 02:54:26