2011-04-05 142 views
6

我试图找出一个解决方案,用于管理一组Linux机器(OS:Ubuntu的,〜40个节点相同的硬件)。这些机器应该是彼此的图像,安装在其中的软件需要安装在其他机器上。我的软件需求是hadoop,R和servicemix。在所有的机器R封装也需要同步(安装包放在一个必须适用于所有的人)Ubuntu的集群管理

一个解决方案,我使用的是现在是使用NFS和PSSH。我希望有更好的/更简单的解决方案,这会让我的生活变得更轻松。任何建议表示赞赏。

回答

5

两个流行的选择是从木偶实验室Puppet和Opscode公司Chef

另一个潜在的机制是创建Requires:需要的数据包在所有机器上安装了新的元数据包。当您修改元数据包时,apt-get update && apt-get -u dist-upgrade会同时在您的所有系统上安装新数据包。

的元数据包的方法可能不太配置和使用最初的工作,但木偶或厨师可能会提供更好的投资回报,从长远来看,他们可以管理远不止软件包安装。

3

我过去曾使用低科技apporach,通过简单地共享(至少部分)/usr/local/来保留共同的R库在/usr/local/lib/R/site-library/。我想这也可以用于你的Hadoop安装。

我试图保持于Debian/Ubuntu的软件包休息,并保持所有节点的电流。本地R和Ubuntu软件包存储库(用于本地创建的软件包)也可以提供帮助,但还有一些工作要做。