2012-02-12 41 views
1

我连接三台服务器采用秃鹰作为一个中间件,形成一个HPC集群,当我从中央管理器不显示其他节点运行命令condor_status我可以运行在工作岗位中央管理器并连接到通过SSH的其他节点,但似乎有什么东西在我设置的中央管理器为秃鹰秃鹰主机配置文件丢失,并允许写入和读出的每一个人。我在守护程序列表中为守护程序列表保留守护进程MASTER,STARTD。神鹰中央管理器无法看到其他的计算节点

当我在中央管理器中运行condor_status时,它只显示中央管理器,当我在计算节点上运行它时,它给我提供了错误“CEDAR:6001:无法连接到”,随后是中央管理器IP和端口数。

回答

1

我设法解决这个问题。问题出在中央管理员的防火墙(在我的情况下是iptables),它正在运行。 所以,当我停止了防火墙(苏-c“服务iptables的停止”)的所有节点通常出现,打字condor_status”。

防火墙状态可通过检查‘服务iptables的状态’。

0

有许多的东西,可怎么回事。我建议你按照这个教程,并看看是否能解决你的问题 -

http://spinningmatt.wordpress.com/2011/06/12/getting-started-creating-a-multiple-node-condor-pool/

+0

欢迎堆栈溢出!你不应该只给一个链接到另一个网站作为。一个答案,因为该网站可能会过时,将来代替,点击这个答案的“编辑”链接,包括从这里页的方案的关键部分请参见:http://meta.stackexchange.com/q/8259 – 2012-02-12 23:21:32

0

在我情况下,服务“condor.exe”并没有在服务器上运行。我已经手动停止。我刚开始它和每一件事都很好。

相关问题