我正在编写一个OpenCL
代码来查找最佳工作组大小以在GPU上具有最大占用率。为此,我需要一个返回每个计算单元的最大工作项数的函数。OpenCl最大工作项目每个计算单位
基本上,我从CUDA
代码派生出这个,我想要一个相当于maxThreadsPerMultiProcessor
。 在CUDA这些是在设备上的查询所返回的值: 每个多处理器的最大线程数:2048 每个块的线程的最大数目:1024
在OpenCL的: CL_DEVICE_MAX_WORK_GROUP_SIZE:1024
在CUDA它不” t要求内核信息返回此值。 我需要OpenCL的等效函数。 在此先感谢。