gpu

    4热度

    1回答

    切割性能我读这篇文章: FPGA or GPU? - The evolution continues 而且有人发表了评论,他写道: 由于GPU是SIMD任何代码用“的if-else”语句将削减一半的 性能。一半核心将执行 语句的if部分,而一半核心处于空闲状态,然后另一半核心将执行其他计算,而核心的前一半 保持空闲状态。 我不明白为什么? 为什么使用GPU(即OpenCL)使用if-else时性能

    0热度

    2回答

    我做了一个非常简单的网络使用mxnet(两个fc层暗淡512)。 通过更改ctx = mx.cpu()或ctx = mx.gpu(0),我在CPU和GPU上运行相同的代码。 GPU的内存成本比CPU版本要大得多(我使用'top'代替'nvidia-smi')。 看起来很奇怪,由于GPU版本已经在GPU上拥有内存,为什么GPU仍然需要更多内存空间? (第1行CPU的程序/ 2行GPU程序)

    1热度

    1回答

    我试图用GPU的版本安装tensorflow,但总是失败。 计算机系统:赢得10专业 显卡:的NVIDIA Quadro M2000M(我确认此卡Nvidia的官方网站,它可以支持CUDA) 我的安装过程: 1-安装快速环境编辑器 2-安装DXSDK_Jun10.exe 3-安装cuda_8.0.61 \贴片2的d CUDNN5.1 4-安装Visual Studio 2015年社会 然后,我测试

    0热度

    1回答

    我想在OpenCVSharp 2.4.10的C#项目中启用GPU。 我已搜查过计算器,并发现了一些线程 OpenCvSharp installed using NUGET PAckage Manager not detecting a CUDA Device 但很难找到对我来说是很好的解决方案。 我用CUDA成功构建了OpenCV 2.4.10。我的opencv_gpu2410.dll是355mb

    -1热度

    1回答

    我有一个序列长度不同的数组,每个序列以'>'结尾。 seq = [a,b,f,g,c,d,>,b,g,d,> ....]。我计算了每个序列的长度并将其存储在一个名为seq_length = [6,3,5,...]的不同数组中。然后,我使用排他扫描来计算偏移量并将其存储在一个名为offset = [0,6,9,...]的数组中。 我想要的是让每个块通过使用偏移值从数组seq []中读取一个序列。例如

    0热度

    1回答

    使用已分配的缓冲区(使用CUDA或者OpenCL的) 我一直在寻找一种方式,而不必初始化一个已分配GPU缓冲区的数据(从OpenCL的,Cuda的或OpenGL)一cv::Umat将数据复制回CPU端。 理想的情况下,没有复制操作是参与和UMAT将“包装”围绕在GPU(这是以前使用CUDA/OpenCL的/ OpenGL的分配)已经存在的数据。如果不工作,也可以接受的在OpenCL/CUDA缓冲器

    1热度

    1回答

    我有一个二进制图像作为输入。二进制图像包含前景中的几个不相交区域。 对于不在某个区域的每个像素,我想知道距离最近区域边界的距离。这是一个标准的图像处理算法?如果是这样,那叫什么?它看起来与距离变换算法不同。 我想出的bruteforce解决方案是使用Sobel边缘检测区域边界。然后,对于不在某个区域中的每个像素,计算与所有边界像素的距离并取最小值。 我将在CUDA中实现它,所以我在考虑将边界像素放

    0热度

    1回答

    您好,我尝试在Windows中安装mxnet R. 接下来是mxnet.com网页,https://mxnet.incubator.apache.org/get_started/install.html, 我运行了prebuild包。该命令看起来会成功运行。但是当我通过“library(mxnet)”启动mxnet时,我看到以下错误。 库(mxnet) 错误:包或命名空间负荷 'mxnet' 失败

    0热度

    1回答

    我是CUDA和CUB的新手。我发现下面的代码,并试图编译它,但我有这个错误: 致命错误:cub/cub.cuh:没有这样的文件或目录。 CUDA的版本是7.0.27 我该如何解决这个错误? 谢谢!所有的 #include <cuda.h> #include <cub/cub.cuh> #include <stdio.h> int main(){ // Declare, allo

    0热度

    2回答

    我有一个实例可以从gcloud命令升级和降级机器类型。例如,我可以做 gcloud compute instances set-machine-type instance-name --machine-type f1-micro 降级现有的实例,并 gcloud compute instances set-machine-type ubuntu --machine-type n1-standa