存储数据的简单方式我有一个Python脚本,做了沿着线:从多个进程
def MyScript(input_filename1, input_filename2):
return val;
即每对输入的,我计算某些浮点值。请注意val是一个简单的double/float。由于这种计算非常密集,我将跨越不同的进程(可能在同一台计算机上,可能在多台计算机上)运行它们。
我之前做的是我输出这个值到一个文本文件:input1_input2.txt。然后,我将有1000000个文件,我需要将其缩减为一个文件。这个过程不是很快,因为操作系统不喜欢文件太多的文件夹。
如何将所有这些数据有效地存入一台计算机?也许让MongoDB在计算机上运行并且所有进程都会一起发送数据?
我想要简单的东西。我知道我可以在MPI中做到这一点,但我认为对于这样一个简单的任务来说是过度的。