gpgpu

    2热度

    1回答

    我试图访问System.Collections.Generic.IList<T>的值,这是在Alea.Gpu.Default.For之外声明的。 [GpuManaged] private void Evaluate_Caching(IList<TGenome> genomeList) { var gpu = Gpu.Default; gpu.For(0, genomeLi

    1热度

    1回答

    我试图利用我的Nvidia Geforce GT 740M进行并行编程,使用OpenMP和铿锵3.8编译器。 当在CPU上并行处理时,我设法得到想要的结果。但是,在GPU上处理时,我的结果几乎是随机数。 因此,我认为我没有正确地分配我的线程团队,并且可能会有一些数据竞赛。我想我必须以不同方式执行我的for循环,但我不知道错误可能在哪里。 #include <stdio.h> #include <

    3热度

    1回答

    假设我使用clEnqueueWriteBuffer将数据复制到设备,并且假设数据是RGB值(unsigned char s)的缓冲区。我想先通过操作输入缓冲区(例如通过覆盖R组件)来将图像转换为灰度,然后我想将生成的图像调整为输出缓冲区。然后我会使用clEnqueueReadBuffer将输出复制回主机内存。由于我不能编写一个包含所有逻辑的单个内核(因为OpenCL处理的内在无序性),所以我在考虑

    0热度

    1回答

    我试图从命令行中运行R. “nvprof” 这里是我正在做它: ./nvprof --print-GPU-跟踪--devices 0 - -analysis-metrics -export-profile/home/xxxxx /%p R 这给了我一个R提示符并且我写了R代码。我也可以用Rscript来做。 的问题,我看到的是,当我给--analysis度量选项它给了我很多类似 == == 440

    -1热度

    2回答

    试图运行这样的:在一个NVS4200M,这是sm_21,不sm_35根据需要 https://github.com/Celebrandil/CudaSift 。 在运行中提到的项目的唯一问题是此代码(cudaSiftD.cu:205): 对(INT I = 1;我< = 16; I * = 2) 总和+ = __shfl_xor(总和, 一世); 是否有可能的等效代码?

    -1热度

    1回答

    A C++标准库用下面的代码(忽略各种包装和概念支票等的)与简单的循环实现std::copy: for (; __first != __last; ++__result, ++__first) *__result = *__first; 现在,假设我想的通用为经线std::copy样函数(未块;不栅极)以用于协作从一个地方将数据复制到另一个。为了简单起见,我们甚至假设函数使用指针而不

    0热度

    1回答

    我想了解parallel forall post on instruction level profiling。尤其是在部分以下行减少了内存相关暂停: NVIDIA的GPU不具备索引寄存器文件,因此,如果堆叠阵列与动态索引进行访问,编译器必须分配在本地存储阵列。在Maxwell体系结构中,本地内存存储不会在L1中进行缓存,因此在存储很重要之后本地内存负载的延迟时间很长。 我明白寄存器文件是,但它是

    0热度

    1回答

    我是GPGPU和CUDA的新手。从我的阅读中,在当代CUDA GPU上,线程被捆绑成32个线程的变形。变形中的所有线程都执行相同的指令,所以如果分支中存在分歧,所有线程基本上都花费相应的时间来获取所有发生的分支。然而,似乎在GPU上同时执行的不同warps可以具有不同的分支而没有这个成本,因为不同的warp是由单独的计算资源执行的。所以我的问题是,在发散不会导致这种情感的情况下,可以如此执行多少个

    4热度

    1回答

    我正在使用GEFORCE GTX 1080 ti(11GB)的tf-seq2seq包来训练NMT模型。在训练模型期间,执行nvidia-smi表明,在所有CPU内核繁忙时,GPU易失性利用率始终小于25%。为什么? 我怎么能找到,如果我利用我的GPU的全部潜力?

    -1热度

    1回答

    我写了多个使用CUDA的代码,我之前进行了大量的配置。 我正在分析的代码现在给我一个奇怪的对话框 无法配置应用程序。 “正在分析的应用程序返回非零返回码” 对于所有使用CUDA工具包和我的旧程序的示例程序,分析器都正常工作。另外我在同一个文件上尝试了一个旧程序(通过评论我当前的代码并在同一个源文件中复制其中一个旧文件),而且令人惊讶的是,该配置文件工作正常。 注意:在构建或调试时代码运行正常,没有