npp

    0热度

    1回答

    上述函数如何在cuda中执行操作。我们是否需要编写CudaMalloc()或MemCopy()以及这个或者只是一个内部调用。 I“中”是具有输入图像和“出”载体是空载体写 nppiResizeSqrPixel_32f_C4R(&in[0],sizeofImage,StepSize,&out[0],StepSizeOutput,DestRoi,Xfactor,YFactor,NULL,NULL,16

    1热度

    1回答

    nppiGraphcut_32s8u函数对32位带符号整数边缘能力有效。在CUDA 6.5工具包中包含的grabCut示例中,他们只需将Npp32f转换为Npp32s即可。例如,从GrabcutUtil.cu在grabcutNPP例如文件夹: // Top/Bottom Npp32s bottom; bottom = _FIXED(edge_weight(center, tex2D(image

    0热度

    1回答

    我对NPP库有一些疑问...... 这是关于步骤在NPP参数。 当我使用NPP库时,它让我感到困惑。 nppiSub_32s_C1RSfs(d_sink, step, d_source, step, d_terminals, step, size, 0); 即例如.. 我可以理解,除了步骤的所有参数。每个NPP功能都需要该步骤。 一些人利用width ... 一些人利用width * sizeof

    -1热度

    2回答

    我尝试使用CUDA和Qt来模糊图像。 我用NPP库,nppiFilterGauss_8u_C1R的伟大工程 void cuda_npp_gauss_filter_qt(uchar* pSourceData, uchar* pResultData, const int &ImageLineStep, const int &ImageWidth, const int &ImageHeight) {

    0热度

    1回答

    CUDA允许使用cuMemcpy异步函数和流重叠计算和数据传输。但是NPP(Performance Primitives)有可能吗? 有点背景。我试图利用GPU使用NPP图像调整大小功能(在我们的例子中,它是nppiResize_8u_C3R)。我使用固定内存并使用cuMemcpy2DAsync_v2和每个线程流成功地将数据传输到GPU。问题是nppiResize_8u_C3R和所有其他计算功能不

    1热度

    1回答

    我正在使用Cuda 7.5和GeForce GTX 650 Ti进行图像处理项目。我决定使用2个数据流,一个应用负责增强图像的算法,另一个应用另一个处理其他处理的独立算法。 我写了一个例子来展示我的问题。在这个例子中,我创建了一个流,然后我使用了nppSetStream。 我调用函数nppiThreshold_LTValGTVal_32f_C1R,但执行该函数时使用了2个流。 这里有一个代码示例:

    1热度

    1回答

    我想用nppiFilterGauss_8u_C1R,但是当我使用CUDA-MEMCHECK,它总是报出界的,这里是我的源代码: Npp8u* p1 = NULL; Npp8u* p2 = NULL; unsigned char* p3 = NULL; unsigned char* p4 = NULL; int step1 = 0; int step2 = 0; NppiSize roi

    1热度

    3回答

    我是cuda驱动程序Api接口的新手,但我认为CUdeviceptr看起来像一个句柄参数。所以我对CUdeviceptr和npp8u *之间的转换感到困惑。 Npp8u * src; ...... unsigned char temp; temp = src; CUdeviceptr devPtr; ....... devPtr = (CUdeviceptr)temp; 我试图写出

    1热度

    1回答

    在两个不同的体系结构(GTX480和GTX TITAN)中,使用nppiCopyConstBorder_8u_C1R函数的性能下降,也涉及到不同的CUDA版本(分别为v5.0和v5.5)。 在第一种情况(GTX480和CUDA 5.0)的功能的执行时间是 T = 0.00005 seconds 在第二种情况下(GTX TITAN和CUDA 5.5)的执行时间是 ​​ 我用以下代码复制了此行为:

    0热度

    1回答

    最后更新 CUDA NPP中值滤波:解决。 WDDM超时也是一个问题。找到了解决方案:WDDM timeout fix。谢谢罗伯特。 更新:感谢罗伯特指出,过滤器的中心不是0,0。不幸的是,如果过滤器增加了,那么您发布的代码将会打破我的说法,比如17x17。这可能是由于您没有考虑图像“侧面”的边界。在任何情况下,这里是最当前的代码,但作为前仍表现出同样的问题... //npp #include