-1
你有耐心回答新手吗?对2D图像的CUDA卷积的快速/简单应用?
(我改写基于答复这个问题。)
我需要在许多2K x 2K分辨率的图像(浮动)进行卷积内核(16×16浮动)。有没有在cuBLAS或cuFFT(cuFFT我假设我必须首先将图像和内核转换为傅立叶空间)的东西? (让我们假设我不能使用openCV或NPP,除非它是复制源代码)。
哪个选项,你将需要:
- 使用CUFFT并转换图像和内核傅立叶空间,过滤器,然后逆FFT?
- 沿着我自己的NVIDA SDK和:https://www.evl.uic.edu/sjames/cs525/final.html
- 看看做一个盒子过滤器,并使用积分(和图像)。
正如你的链接中指出的那样,nvidia可分卷积样本代码非常快,并且[包括白皮书](http://docs.nvidia.com/cuda/cuda-samples/index.html#cuda-separable -卷积) – 2015-01-09 19:24:03