gpu

4热度

1回答

切割性能我读这篇文章： FPGA or GPU? - The evolution continues 而且有人发表了评论，他写道：由于GPU是SIMD任何代码用“的if-else”语句将削减一半的性能。一半核心将执行语句的if部分，而一半核心处于空闲状态，然后另一半核心将执行其他计算，而核心的前一半保持空闲状态。我不明白为什么？为什么使用GPU（即OpenCL）使用if-else时性能

0热度

2回答

为什么mxnet的GPU版本比CPU版本更耗费内存？

我做了一个非常简单的网络使用mxnet（两个fc层暗淡512）。通过更改ctx = mx.cpu（）或ctx = mx.gpu（0），我在CPU和GPU上运行相同的代码。 GPU的内存成本比CPU版本要大得多（我使用'top'代替'nvidia-smi'）。看起来很奇怪，由于GPU版本已经在GPU上拥有内存，为什么GPU仍然需要更多内存空间？（第1行CPU的程序/ 2行GPU程序）

1热度

1回答

tensorflow：没有名为'_pywrap_tensorflow_internal'的模块

我试图用GPU的版本安装tensorflow，但总是失败。计算机系统：赢得10专业显卡：的NVIDIA Quadro M2000M（我确认此卡Nvidia的官方网站，它可以支持CUDA）我的安装过程： 1-安装快速环境编辑器 2-安装DXSDK_Jun10.exe 3-安装cuda_8.0.61 \贴片2的d CUDNN5.1 4-安装Visual Studio 2015年社会然后，我测试

0热度

1回答

c＃OpenCVSharp 2.4.10与GPU

我想在OpenCVSharp 2.4.10的C＃项目中启用GPU。我已搜查过计算器，并发现了一些线程 OpenCvSharp installed using NUGET PAckage Manager not detecting a CUDA Device 但很难找到对我来说是很好的解决方案。我用CUDA成功构建了OpenCV 2.4.10。我的opencv_gpu2410.dll是355mb

-1热度

1回答

块读取不同长度的序列gpu

我有一个序列长度不同的数组，每个序列以'>'结尾。 seq = [a，b，f，g，c，d，>，b，g，d，> ....]。我计算了每个序列的长度并将其存储在一个名为seq_length = [6,3,5，...]的不同数组中。然后，我使用排他扫描来计算偏移量并将其存储在一个名为offset = [0,6,9，...]的数组中。我想要的是让每个块通过使用偏移值从数组seq []中读取一个序列。例如

0热度

1回答

OpenCV的3.X - 为UMAT

使用已分配的缓冲区（使用CUDA或者OpenCL的）我一直在寻找一种方式，而不必初始化一个已分配GPU缓冲区的数据（从OpenCL的，Cuda的或OpenGL）一cv::Umat将数据复制回CPU端。理想的情况下，没有复制操作是参与和UMAT将“包装”围绕在GPU（这是以前使用CUDA/OpenCL的/ OpenGL的分配）已经存在的数据。如果不工作，也可以接受的在OpenCL/CUDA缓冲器

1热度

1回答

距离区域

我有一个二进制图像作为输入。二进制图像包含前景中的几个不相交区域。对于不在某个区域的每个像素，我想知道距离最近区域边界的距离。这是一个标准的图像处理算法？如果是这样，那叫什么？它看起来与距离变换算法不同。我想出的bruteforce解决方案是使用Sobel边缘检测区域边界。然后，对于不在某个区域中的每个像素，计算与所有边界像素的距离并取最小值。我将在CUDA中实现它，所以我在考虑将边界像素放

0热度

1回答

我无法在Windows 10中启动mxnet R GPU for

您好，我尝试在Windows中安装mxnet R. 接下来是mxnet.com网页，https://mxnet.incubator.apache.org/get_started/install.html, 我运行了prebuild包。该命令看起来会成功运行。但是当我通过“library（mxnet）”启动mxnet时，我看到以下错误。库（mxnet）错误：包或命名空间负荷 'mxnet' 失败

0热度

1回答

致命错误：cub/cub.cuh：没有这样的文件或目录

我是CUDA和CUB的新手。我发现下面的代码，并试图编译它，但我有这个错误：致命错误：cub/cub.cuh：没有这样的文件或目录。 CUDA的版本是7.0.27 我该如何解决这个错误？谢谢！所有的 #include <cuda.h> #include <cub/cub.cuh> #include <stdio.h> int main(){ // Declare, allo

0热度

2回答

使用GPU从gcloud命令升级实例

我有一个实例可以从gcloud命令升级和降级机器类型。例如，我可以做 gcloud compute instances set-machine-type instance-name --machine-type f1-micro 降级现有的实例，并 gcloud compute instances set-machine-type ubuntu --machine-type n1-standa