2015-02-17 76 views
0

如果我在相同的上下文中启动多个CUDA内核,并且内核之间存在依赖关系(输入中的第一个输出到第二个输出等),那么每个内核完成后控制权会返回到主机执行?如果没有,请您简单描述CUDA卡上的“内核入队”机制是如何工作的?启动多个CUDA内核是否涉及到每个内核的主机?

+0

是的,它的确如此。除非你用CUDA流异步地调用内核,否则它将启动第一个内核,在它完成之前等待,然后启动第二个内核,等等。我不确定你的意思是“控制返回主机”,只要主持人总是有控制权(据我所知,我不是一个好专家)。 – 2015-02-18 00:44:59

回答