2012-02-28 80 views
0

我有一种特殊的问题。batchedgemm源代码?

我有一些研究代码,我使用CUDA 4.1在我的Macbook上开发的,尤其是使用batchedgemm。我现在必须在我从另一个机构借出的一群gpu上运行它。

我的问题是,群集只安装了CUDA 4.0,并且他们不愿意升级得很快。

有谁知道我是否可以在某处获得batchedgemm的源代码并将其编译为4.0以下的版本?

我已经写过自己的内核来完成批量的乘法运算,但是它的执行速度比图书馆的要慢10左右 - 我想站在伟人的肩膀上,而不是脚趾上。

回答

2

我明白不愿意快速升级生产集群。许多集群使用模块系统,这意味着CUDA工具包的多个版本可以共存。但是,驱动程序需要升级到支持最新CUDA的版本。这就是为什么他们不愿意,因为他们需要测试用户的生产代码和应用程​​序,以避免回归或失败。

由于CUBLAS不是开源的,我建议您尝试在单独的机器上开发您的代码,并且如果您从批处理中获得大量加速,请将其作为升级原因呈现给管理员。