0
我正在实现一个简单版本的矩阵每矩阵乘法和矩阵每个向量与openblas与dgemm和dgemv的乘法。我看到openblas只运行在一个核心上。在多核上运行openblas
我试着添加-lpthread进行编译,但没有成功。
我打电话DGEMM和dgemv的方法很简单:
在多个内核上cblas_dgemv(order, trans, m, n, alpha, a, lda, x, incx, beta, y, incy);
cblas_dgemm(M, N, K, alpha, A, 1, M, B, 1, K, beta, C, 1, M);
有没有人成功运行openblas?