2016-08-03 74 views
0

我可以获得每个内核的warp_execution_efficiency,但是如何获得我的程序的总warp_execution_efficiency?CUDA扭曲执行效率

回答

2

注意:计算所有内核中的单个数字对于优化目的不太可能有用。

NVIDIA的分析器是以内核为中心的,所以直接查询信息是不可能的。但是,您可以运行nvprof --csv --metrics warp_execution_efficiency,然后将输出结果放入Excel,R或您最喜爱的统计软件中,并在其中混淆。

这样做的一个问题是,warp_execution_efficiency涉及平均值,所以你不能只取平均值。您可能能够获得Visual Profiler不提供的一些便利可视化。