1
NVIDIA CUDA的PTX优化汇编,ptxas
,有以下几个选项:CUDA ptxas的--abi-compile = yes选项是什么(需要花费注册表)?
--abi-compile <yes|no> (-abi)
Enable/Disable the compiling of functions using ABI.
Default value: 'yes'.
ABI那是什么?当你禁用它会发生什么?它似乎导致更少的寄存器使用,嗯...
(问题this GTC 2011 presentation启发关于寄存器溢出。)
这似乎是在讨论PTX代码的差异,而不是它如何编译。 – einpoklum
在寄存器中增加了关于abi及其成本的一些细节。希望这有助于。有关cuda工具链中abi的实际实施的资源很少。 –
因此基本上+2个寄存器(每个函数?)来维护堆栈帧? – einpoklum