因此,cuda可视化剖析器中有2个定时器,cuda可视化剖析器中的CPU和GPU定时器
GPU时间:这是GPU上该方法的执行时间。 CPU时间:它是启动该方法的GPU时间和CPU开销的总和。在驱动程序生成的数据级别,CPU时间仅仅是启动非阻塞方法的方法的CPU开销;对于阻塞方法,它是GPU时间和CPU开销的总和。所有内核默认启动都是非阻塞的。但是如果任何分析器计数器被启用,则内核启动将被阻止。不同流中的异步内存复制请求是非阻塞的。
如果我有一个真正的程序,实际的exectuion时间是多少?我测量时间,还有GPU计时器和CPU计时器,有什么不同?
我想你已经回答了你自己的问题。 – erjiang 2010-12-04 02:13:58