我想优化我的OpenCL内核,现在我所拥有的全部是NVidia Visual Profiler,它似乎相当有限。我希望看到内核的逐行配置文件,以更好地理解与合并有关的问题等。有没有一种方法可以比Visual Profiler提供的更全面的分析数据?剖析OpenCL内核
7
A
回答
1
不,没有这样的工具,但你可以剖析你的代码更改。尝试测量代码的速度,更改内容然后再次测量。 clEnqueueNDRangeKernel有一个事件参数,事后可以和clGetEventProfilingInfo一起使用,定时器非常清晰,精度按微秒级别测量。这是测量单独代码部分性能的唯一方法...
1
我还没有测试它,但我刚刚发现这个程序http://www.gremedy.com/gDEBuggerCL.php。 描述:“这款新产品为OpenCL开发者的世界带来了gDEBugger的高级调试,分析和内存分析功能......”
1
LTPV is an open-source, OpenCL profiler这可能符合您的要求。目前,它只能在Linux下工作。
(披露:我是这个工具的开发者)
4
我认为AMD CodeXL是你在找什么。它是一套免费的工具,包含OpenCL调试器和GPU分析器。 OpenCL调试器允许您对OpenCL内核和主机代码进行逐行调试,查看跨不同工作组的所有变量,查看发生的特殊事件和错误等。GPU分析器具有很好的功能,可以生成一个时间表显示你的程序在数据传输和内核执行等任务上的花费时间。
欲了解更多信息和下载链接,请http://developer.amd.com/tools-and-sdks/heterogeneous-computing/codexl/
相关问题
- 1. 剖析Linux内核模块
- 2. 剖析Linux内核使用的内存
- 3. 在Mac OS X上剖析OpenCL
- 4. 多个OpenCl内核
- 5. 调试OpenCL内核
- 6. OpenCL内核参数
- 7. 杀死OpenCL内核
- 8. 优化opencl内核
- 9. 从另一个OpenCL内核调用OpenCL内核
- 10. 如何剖析cuda内核全局内存事务的数量?
- 11. OpenCL自相关内核
- 12. OpenCL内核错误-11
- 13. OpenCL内核无法编译
- 14. OpenCL内核的优化
- 15. OpenCL内核构建错误
- 16. 等内核完成OpenCL
- 17. 的OpenCL内核+ ClMagma阵列
- 18. OpenCL Gemm内核本地内存变慢
- 19. 剖析
- 20. 无法使用NVidia Visual Profiler剖析OpenCL代码
- 21. 在多个GPU上运行OpenCL内核?
- 22. 使用OpenCL管道时内核挂起
- 23. 如何实现opencl内核管道
- 24. opencl内核中的位反转
- 25. 如何构建大型OpenCL内核?
- 26. OpenCL内核中的自定义类型
- 27. 用调试信息编译OpenCL内核?
- 28. 并行访问OpenCL内核参数值
- 29. OpenCL:使用struct作为内核参数
- 30. Mac OSx上的OpenCL内核错误
OpenXL - GPUOPEN仅适用于AMD处理器,这对于很多用户 – TripleS 2016-07-07 06:04:19
一个主要的限制,我认为你是混合两种不同的方面:CodeXL是一个工具套件AMD是AMD的GPUOpen计划的一部分,是开源产品之一。我认为这一举措的全部目的是让业内开发人员和其他参与者扩展这些工具,以便他们能够支持更多的平台。 – AmitB 2016-07-13 22:31:11