2012-07-19 56 views
4

有关与CUDA的GPU使用数据并行算法有两种标准库, CUDPP和推力,该工具排序,还原,前缀和等推力VS CUDPP

那么什么是库之间的主要差异,在性能和功能方面?

+0

我相信这个问题值得更认真的回答;但我会建议你扩展它以包含[cub](http://nvlabs.github.io/cub/) - 我相信它对于某些/所有计算任务来说比其他两个更快。 – einpoklum 2016-10-30 19:28:22

回答

2

大约一年前,我已经使用了排序和前缀总和(使用CUDA 4.1,但我不记得Thrust和CUDPP的版本),并且我体验到CUDPP速度稍快,但Thrust更容易使用(使用约20M条目的浮点数组)。至于我记得的功能,你可以在主机存储器中使用Thrust,而不仅仅是使用设备存储器(而不是CUDPP),但这可能已经过时了。