2015-01-09 190 views
-1

你有耐心回答新手吗?对2D图像的CUDA卷积的快速/简单应用?

(我改写基于答复这个问题。)

我需要在许多2K x 2K分辨率的图像(浮动)进行卷积内核(16×16浮动)。有没有在cuBLAS或cuFFT(cuFFT我假设我必须首先将图像和内核转换为傅立叶空间)的东西? (让我们假设我不能使用openCV或NPP,除非它是复制源代码)。

哪个选项,你将需要:

  1. 使用CUFFT并转换图像和内核傅立叶空间,过滤器,然后逆FFT?
  2. 沿着我自己的NVIDA SDK和:https://www.evl.uic.edu/sjames/cs525/final.html
  3. 看看做一个盒子过滤器,并使用积分(和图像)。
+0

正如你的链接中指出的那样,nvidia可分卷积样本代码非常快,并且[包括白皮书](http://docs.nvidia.com/cuda/cuda-samples/index.html#cuda-separable -卷积) – 2015-01-09 19:24:03

回答

0

我能够实现算法,使用UIUC学生的论文和Nvidia的白皮书。谢谢罗伯特。