特斯拉(费米或开普勒)与TDM模式相比,与Geforce(相同代)与WDDM?与Geforce相比,Tesla的内核开销少了多少?
我编写的程序有一些非常严重的内核开销问题,因为它必须重复启动内核,开销非常巨大,我必须将许多内核合并到一起并交换内存空间,以减少内核启动次数,但它只能由于GPU内存存储的大小,迄今为止工作。
听说TCC模式可以有更少的开销,但它可以带来的开销performane到CPU'level?
由于我读了一些基准测试,至少对于Geforce 280 GTX而言,内核调用开销比CPU的函数调用开销长数千倍,而且对于需要大量重复迭代的方法,它会产生巨大的性能差异这里。
你可以切换到Windows XP吗?您将不会在那里发生WDDM问题。 – Dredok 2013-03-15 08:51:15