我想将一个物理模拟算法移植到使用OpenCL进行性能的GPU上;我没有使用OpenCL的经验,我正在环顾四周。计算大多是小型密集矩阵(3x3)和矢量产品,交叉产品等。opencl矩阵库
是否有这样的基本操作的“标准”/推荐库?我当然不想码矩阵乘法和反演自己(而不是时间,这将是inefficent)
随着OpenCL的没有类,操作符重载等,我必须写
mmul(a,mtrans(b))
而不是a*b.transpose()
例如?是否有OpenCL(或预处理器)的某些(计划的)扩展/演变,以使符号更像数学?我有回到长年的印象。 (我知道有CUDA,但它是供应商绑定)
对不起,我在思考lin-pack的前几天(当时并不是我正在编程),也就是在有人做了一个很好的实现之前,而不是每个人都为自己编写它。通过类比,我认为Python是一种流行语言的原因之一:“包含电池”。 – eudoxos