我在OpenMP,TBB和OpenCL中实现了很少的正常循环应用程序。在所有这些应用程序中,当我仅在CPU上运行Operate时,Operate的性能远远优于其他应用程序,而在内核中没有进行特定的优化。 OpenMP和TBB也有很好的性能,但远低于OpenCL,可能是因为这些都是CPU专用框架,并且至少应该提供与OpenMP/TBB相同的性能。OpenCL,TBB,OpenMP
我的第二个问题是,当涉及到OpenMP和TBB时,OpenMP在性能上总是比TBB好,因为在我的实现中,我没有对它进行优化,因为我并不那么专业。 OpenMP性能通常比TBB更好吗?因为我认为他们两个甚至是OpenCL都会在低层使用相同类型的线程池......任何专家意见?谢谢
你的算法是什么?什么是您的操作系统和编译器? – osgx