2016-09-24 103 views
0

有没有办法检查我的内核读取和写入是否以合并的方式从/到全局内存?我一直在试图确保我的内核有效地读写内存以获得更好的性能。在CUDA中合并读取/写入

感谢

回答

4

使用分析器如nvprof

的gld_efficiency和gst_efficiency指标会给你合并的全局负载和存储的百分比的直接测量。例如在Linux上:

nvprof --metrics gld_efficiency,gst_efficiency ./my_app