我用gmond_python_modules,试图监视一个集群有几个主机,每个主机有8个GPU。Ganglia中的python gmond_python_modules导入错误
而最后的步骤后,我想我的网络节点上重新启动的gmond服务,只得到:
Starting GANGLIA gmond: Could not find platform independent libraries <prefix>
Could not find platform dependent libraries <exec_prefix>
Consider setting $PYTHONHOME to <prefix>[:<exec_prefix>]
ImportError: No module named site
[FAILED]
我搜索,最初以为是因为我编译无神经节选项--with-python
。但事实并非如此。我重新编译这个选项(检查配置输出,它找到它发现python),一切正常,直到我加入GPU监控python模块。同样的错误再次。
而且我也尝试手动分配PYTHONHOME
和PYTHONPATH
,这没有什么区别。我安装了anaconda。是否可能导致Ganglia找不到正确的载入路径?
欢迎任何想法。并会在需要时提供更多细节。
分布和版本的详细信息:
系统:CentOS的6.8
的Python:2.7的网络节点上,2.6计算节点
神经节:3.7.2
gmond_python_modules:克隆形式Github的今天