npp

0热度

1回答

上述函数如何在cuda中执行操作。我们是否需要编写CudaMalloc（）或MemCopy（）以及这个或者只是一个内部调用。 I“中”是具有输入图像和“出”载体是空载体写 nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16

1热度

1回答

针对非整数边缘能力的NPP图切割

nppiGraphcut_32s8u函数对32位带符号整数边缘能力有效。在CUDA 6.5工具包中包含的grabCut示例中，他们只需将Npp32f转换为Npp32s即可。例如，从GrabcutUtil.cu在grabcutNPP例如文件夹： // Top/Bottom Npp32s bottom; bottom = _FIXED(edge_weight(center, tex2D(image

0热度

1回答

NPP库中的'STEP'是什么？

我对NPP库有一些疑问...... 这是关于步骤在NPP参数。当我使用NPP库时，它让我感到困惑。 nppiSub_32s_C1RSfs(d_sink, step, d_source, step, d_terminals, step, size, 0); 即例如.. 我可以理解，除了步骤的所有参数。每个NPP功能都需要该步骤。一些人利用width ... 一些人利用width * sizeof

-1热度

2回答

CUDA NPP GaussFilter破坏图像

我尝试使用CUDA和Qt来模糊图像。我用NPP库，nppiFilterGauss_8u_C1R的伟大工程 void cuda_npp_gauss_filter_qt(uchar* pSourceData, uchar* pResultData, const int &ImageLineStep, const int &ImageWidth, const int &ImageHeight) {

0热度

1回答

NPP：重叠计算和数据传输

CUDA允许使用cuMemcpy异步函数和流重叠计算和数据传输。但是NPP（Performance Primitives）有可能吗？有点背景。我试图利用GPU使用NPP图像调整大小功能（在我们的例子中，它是nppiResize_8u_C3R）。我使用固定内存并使用cuMemcpy2DAsync_v2和每个线程流成功地将数据传输到GPU。问题是nppiResize_8u_C3R和所有其他计算功能不

1热度

1回答

Cuda，由NPP函数创建的两个流

我正在使用Cuda 7.5和GeForce GTX 650 Ti进行图像处理项目。我决定使用2个数据流，一个应用负责增强图像的算法，另一个应用另一个处理其他处理的独立算法。我写了一个例子来展示我的问题。在这个例子中，我创建了一个流，然后我使用了nppSetStream。我调用函数nppiThreshold_LTValGTVal_32f_C1R，但执行该函数时使用了2个流。这里有一个代码示例：

1热度

1回答

CUDA-MEMCHECK报告nppiFilterGauss_8u_C1R出界

我想用nppiFilterGauss_8u_C1R，但是当我使用CUDA-MEMCHECK，它总是报出界的，这里是我的源代码： Npp8u* p1 = NULL; Npp8u* p2 = NULL; unsigned char* p3 = NULL; unsigned char* p4 = NULL; int step1 = 0; int step2 = 0; NppiSize roi

1热度

3回答

如何将Npp8u *转换为CUdeviceptr

我是cuda驱动程序Api接口的新手，但我认为CUdeviceptr看起来像一个句柄参数。所以我对CUdeviceptr和npp8u *之间的转换感到困惑。 Npp8u * src; ...... unsigned char temp; temp = src; CUdeviceptr devPtr; ....... devPtr = (CUdeviceptr)temp; 我试图写出

1热度

1回答

性能下降nppiCopyConstBorder_8u_C1R

在两个不同的体系结构（GTX480和GTX TITAN）中，使用nppiCopyConstBorder_8u_C1R函数的性能下降，也涉及到不同的CUDA版本（分别为v5.0和v5.5）。在第一种情况（GTX480和CUDA 5.0）的功能的执行时间是 T = 0.00005 seconds 在第二种情况下（GTX TITAN和CUDA 5.5）的执行时间是我用以下代码复制了此行为：

0热度

1回答

16个图像

最后更新 CUDA NPP中值滤波：解决。 WDDM超时也是一个问题。找到了解决方案：WDDM timeout fix。谢谢罗伯特。更新：感谢罗伯特指出，过滤器的中心不是0,0。不幸的是，如果过滤器增加了，那么您发布的代码将会打破我的说法，比如17x17。这可能是由于您没有考虑图像“侧面”的边界。在任何情况下，这里是最当前的代码，但作为前仍表现出同样的问题... //npp #include