2017-08-29 144 views
1

我试图在Ubuntu ppc64le上用CUDA-9构建TF 1.3。有了CUDA-9支持所需的所有补丁(eigen,nccl,甚至[TF's PR](https://github.com/tensorflow/tensorflow/pull/12502)),我可以构建大部分TF代码,但是,它在编译tensorflow/core/kernels/fft_ops.cc。 我用CUDA-8检查过TF1.3,它在ppc64le上没有任何问题。有没有人遇到过这种问题?我试过bazel 0.4.5和0.5.3以及两个版本,问题仍然存在,即使将TF的PR用于CUDA-9支持也不会对构建问题产生影响TF 1.3版本与CUDA-9挂在ppc64le

+0

我发现调用fft_ops.cc文件中CPU的所有FFT内核注册导致挂起,但不知道如何以及为什么。注释掉这些代码也可以让TF成功编译。任何指针都会很有帮助。谢谢。 –

+0

我发现这个挂起的原因。这是由于Eigen的局部变化已经为我们的旧TF(<1.3)+ CUDA-8工作,但与新TF(> 1.3)和CUDA-9及其各自的Eigen无关。因此关闭这个。 –

回答

0

我找到了导致此挂起的原因,这是由于Eigen的本地更改一直在为我们工作旧的TF(< 1.3)+ CUDA-8,但没有新的TF(> 1.3)和CUDA-9以及它们各自的Eigens。在Ubuntu上,问题以挂起的形式被提出,没有线索,而RHEL很友善地抛出该确切的错误。 谢谢, Nishidha