我正在尝试使用OpenCL加速一些计算,部分算法由反转矩阵组成。是否有任何开源库或免费代码来计算在OpenCL或CUDA中编写的矩阵或常规反演的lu分解(lapack dgetrf和dgetri)?矩阵是真实的和方形的,但除此之外没有任何其他特殊属性。到目前为止,我已经设法在gpu上找到基本的blas矩阵向量操作实现。OpenCL中的矩阵求逆
该矩阵相当小,只有大约60-100行和列,所以它可以在CPU上更快地计算,但它在算法中间使用,所以我不得不将它转移到主机,计算反过来,然后将结果传回设备,然后将其用于更大的计算。
您还应该注意,反转矩阵可能是一项昂贵的操作,特别是对于大型矩阵,并且通常有其他解决手头问题的方法。 LU分解是一个“构建块”,可以用来避免做一个真正的逆转。 – Tom 2010-06-01 11:53:39