kernel1 <<< blocks1, threads1, 0, stream1 >>> (args ...);
...
kernel2 <<< blocks2, threads2, 0, stream2 >>> (args ...);
...
我有两个内核同时运行,
和设备是GTX460,所以它是费米架构。
cuda工具包和sdk是3.2 rc。
与上面的代码类似,两个内核编码为同时运行,
但是没有来自任何内核的响应。如何在一个GPU上使用CUDA运行多个内核?
内核在做什么有什么限制? 两个内核共享一些数据
它们有一些共同之处。
如果我注释掉大部分内核函数,那么程序暂停。
请给我任何帮助。
“如果我注释掉大部分内核函数,那么程序就会暂停。”这是什么意思?更多细节将会有所帮助。 – Marm0t 2010-10-28 16:47:58
你能发布更多信息吗?我努力去理解你所做的事情,你期望发生的事情以及实际发生的事情。 – Tom 2010-10-30 18:26:44