4
A
回答
2
大约一年前,我已经使用了排序和前缀总和(使用CUDA 4.1,但我不记得Thrust和CUDPP的版本),并且我体验到CUDPP速度稍快,但Thrust更容易使用(使用约20M条目的浮点数组)。至于我记得的功能,你可以在主机存储器中使用Thrust,而不仅仅是使用设备存储器(而不是CUDPP),但这可能已经过时了。
相关问题
- 1. 算法在推力/ cudpp中找到第k个最小元素
- 2. OpenMPI CUDA和CUDPP
- 3. cudpp仅适用于某些计算能力的设备
- 4. CUDA CUDPP .so建筑
- 5. curand,推力::随机
- 6. 推力异常:“推力::系统:: SYSTEM_ERROR在存储器位置00000000”
- 7. 推力没有提供使用推力的预期结果:: minimum
- 8. 步推力排序和推力的独特的复杂性
- 9. 计算在质量任意位置给定任意推力器的偏置推力器位置的推力
- 10. 力抛出异常的VS
- 11. 计算推力梯度:: device_vector
- 12. 插入host_vector使用推力
- 13. 使用std :: bind2nd与推力
- 14. CUDA推力阵列长度
- 15. 使用推力与printf/cout
- 16. CUDA /推力图像处理
- 17. 性能推力::计数
- 18. 推力::系统:: SYSTEM_ERROR在transform_reduce
- 19. Cuda的推力 - 最大VEC3
- 20. 推力:sort_by_key与zip_iterator性能
- 21. 推力CUDA发现最大
- 22. 意外的推力错误
- 23. VS 2008推荐.Net Obfuscater?
- 24. EvtSubscribe拉Vs的推模式
- 25. 力CUDA的推力::减少,没有并行
- 26. 登录和蛮力:CAPTCHA-vs-睡眠(1)
- 27. Spark 1.6 vs spark 2.0生产力
- 28. 蟒2:计算大权力VS其MODS
- 29. 推力copy_if设备到主机
- 30. 什么时候应该用力推?
我相信这个问题值得更认真的回答;但我会建议你扩展它以包含[cub](http://nvlabs.github.io/cub/) - 我相信它对于某些/所有计算任务来说比其他两个更快。 – einpoklum 2016-10-30 19:28:22