2012-03-08 65 views
2

我想用openMPI设置一个相对较小的集群(36个内核),并且遇到了一个小问题。我已经安装了所有openMPI库和任何依赖项并且运行正常(我可以在每台计算机上运行hello world MPI程序作为本地主机)。问题是,我似乎无法找到关于如何让计算机一起执行程序的太多文档。我可以执行mpirun --hostfile命令,但我不想每次执行作业时都必须指定主机文件。另外,未来的用户无法一直访问群集上的所有IP地址。他们和我希望能够执行mpirun -np 20 programFile,没有任何问题。有人可以提供一些指导我需要做什么从这一点?公平地说,我只在大学里上过一门课,在那里我们编写了与MPI并行的程序,但他们从来没有向我们展示如何用openMPI建立一个新的集群。我很欣赏你们可以提供的任何建议。我通过我的搜索MPICH_Cluster_Setup发现了这个指南,如果它是openMPI,那将会很棒。那里是否有与openMPI有关的类似指南?openMPI主节点设置配置

回答

1

您应该使用像Torque,SLURM或SGE这样的集群调度程序(全部是免费的/ FOSS)。这些允许用户保留节点供其使用,并且所有的“谈话”都可以打开MPI以告知它用于该用户作业的节点(以便它们不必使用主机文件)。

根据MPICH集群设置文档,它只是关于您打开MPI所需的内容,但不需要在最后设置MPD(无论如何,MPICH都已弃用MPD)。