0
现在,我正在使用多核心机器中的OpenMP进行并行编程。我是并行编程的新手。需要关于使用OpenMP的并行编程的一些帮助?
到现在我已经做了以下事情:使用OpenMP
与变化计算执行时间在不同的机器线程的数量
百万X百万矩阵乘法的运算程序(像corei5,corei3)
我已经看到,当没有线程= 4时,它的最小时间需要执行我的代码。 (我不知道为什么)
其总体表现分析。现在我想去gem5。现在我能做什么或对我来说什么是正确的方式?我想知道,我能从这里做什么。我需要一个想法。