此代码不除平方基质如a[4][4]
,b[4][4]
,result2[4][4]
工作,但它并没有为a[4][10]
,b[10][10]
工作,result2[4][10]
非方阵乘积
//Init
for(r=0;r<numrowsa;r++){
for(c=0;c<numcolsa;c++){
a[r][c]=rand()%101;
}
}
for(r=0;r<numrowsb;r++){
for(c=0;c<numcolsb;c++){
b[r][c]=rand()%101;
}
}
for(r=0;r<numrowsr;r++){
for(c=0;c<numcolsr;c++){
result[r][c]=0;
}
}
for(r=0;r<numrowsr2;r++){
for(c=0;c<numcolr2;c++){
result2[r][c]=0;
}
}
//end init
t1=clock();
//trying parallel calculation
# pragma omp parallel num_threads(4) private(j)
{
int thr = omp_get_thread_num();
if(thr == 0)
for(c=0;c<numcolsr;c++){
for(j=0 ;j<numcolsa ; j++)
result[0][c]+=a[0][j]*b[j][c];
}
else if (thr ==1)
for(c=0;c<numcolsr;c++){
for(j=0 ; j<numcolsa ; j++)
result[1][c]+=a[1][j]*b[j][c];
}
else if (thr ==2)
for(c=0;c<numcolsr;c++){
for(j=0 ; j<numcolsa ; j++)
result[2][c]+=a[2][j]*b[j][c];
}
else if (thr ==3)
for(c=0;c<numcolsr;c++){
for(j=0 ; j<numcolsa ; j++)
result[3][c]+=a[3][j]*b[j][c];
}
}
t2=clock();
cout <<endl<< "Time"<<t2-t1<<"ms"<<endl;
t1 = clock();
//trying serial calculation
for(r=0;r<numrowsr2;r++){
for(c=0;c<numcolr2;c++){
for(i=0 ; i<numcolsa ; i++)
result2[r][c]+=a[r][i]*b[i][c];
}
}
t2 = clock();
/*
for(r=0;r<numrows;r++){
for(c=0;c<numcols;c++){
cout <<result[r][c]<<" ";
if(c == numcols-1)
cout << endl;
}
}
*/
cout <<endl<< "Time"<<t2-t1<<"ms"<<endl;
的错误是
运行时检查失败栈变量
'b'
被损坏
什么问题?
即使你可以得到它的工作,它可能会比单线程版本慢 – 2011-05-14 22:12:05
你正在访问数组'b'范围之外的内存。 – 2011-05-14 22:12:40
大卫:我只是在做h – Ahmed 2011-05-14 22:13:35