numba-pro

0热度

1回答

我一直在关注一个例子（https://github.com/ContinuumIO/numbapro-examples/blob/master/convolution/fftconvolve.py）给与fftconvolve与图像和内核，都是二维数组。在我的用例中，我想用两个1D阵列来做fftconvolve来寻找可能的匹配和延迟。我试图将示例转换为1D，但收到了几个Invalid type co

0热度

1回答

为什么我不能用numba（cuda python）获得正确的1D数组的总和？

我尝试用numba来使用cuda python。代码是计算1D数组的总和如下，但我不知道如何得到一个值的结果，而不是三个值。 python3.5与numba + CUDA8.0 import os,sys,time import pandas as pd import numpy as np from numba import cuda, float32 os.environ['NUM

4热度

1回答

Python的括号函数名和参数之间：FUNC [...]（...）

我正在学习如何在GPU加速计算蟒从this notebook，其中一条线让我困惑： mandel_kernel[griddim, blockdim](-2.0, 1.0, -1.0, 1.0, d_image, 20) 这里，mandel_kernel是一个装饰（由cuda.jit）函数，griddim和blockdim是长度为2的元组：griddim=(32,16),blockdim=(32

-1热度

1回答

GPU上计算得到错误的结果（python3.5 + numba + CUDA8.0）

我想获得数组的不同部分的总和。我运行我的代码。并从打印的内容中发现两个问题。 PRO1：详细介绍here。它已经解决了。也许这不是一个真正的问题。 PRO2：在我的代码，我红粉不同的值SBUF [0,2]，SBUF [1,2]，SBUF [2,2]和SBUF [0,3]，SBUF [1,3]，sbuf [2,3]。但是发现在cuda.syncthreads()之后，sbuf [0,2]和s

0热度

1回答

中止AWS操作/使用numbapro安装Anaconda

两部分问题，对于任何一部分都非常感谢。我试图在AWS EB上安装Anaconda，然后是numbapro。我在.ebextensions options.config看起来是这样的： commands: 00_download_conda: command: 'wget http://repo.continuum.io/archive/Anaconda2-4.3.0-Linux-x86_64.

1热度

1回答

Anaconda加速check_cuda（）

什么是检查cuda的正确anaconda加速函数？有了你可以使用numbapro： >>> from numbapro import check_cuda numbapro:1: ImportWarning: The numbapro package is deprecated in favour of the accelerate package. Please update your co

0热度

1回答

是否Numbapro支持SIMD编程架构

我试图来解决单纯使用GPU优化的熵问题。因为每一次单纯的迭代都依赖于前一次迭代，所以我相信我没有办法让我的算法平行。但是已经做了PyOpenCl和Numbapro一些研究，OpenCL的提供了一个类型的编程架构的SIMD叫。我只是想知道Numbapro会提供相同的吗？到目前为止，我已经试过jit，autojit &矢量化的代码的一部分，但没有迹象表明性能改善。

2热度

1回答

PyCUDA和NumbaPro CUDA Python有什么区别？

我是CUDA新手，想弄清楚PyCUDA (free)或NumbaPro CUDA Python（不是免费）对我来说是否会更好（假设图书馆的成本不是问题）。两者似乎都要求您使用各自的Python方言。但是，PyCUDA似乎要求你在C代码中编写内核函数，这比使用NumbaPro更麻烦，而NumbaPro似乎为你做了所有的辛苦工作。这的确是这样吗？会有明显的性能差异吗？

0热度

1回答

如何在GPU中计算对数（python3.5 + numba + CUDA8.0）

我在GPU中用math.log计算对数，这是Supported Python features in CUDA Python之一。但失败了。我的代码： import os,sys,time,math import pandas as pd import numpy as np from numba import cuda, float32 import os bpg = (3,1

0热度

1回答

计算矩阵向量乘法与CUDA蟒蛇

我试图用numbapro写下面一个简单的矩阵向量乘法： from numbapro import cuda from numba import * import numpy as np import math from timeit import default_timer as time m = 100000 n = 100 @cuda.jit('void(f4[:,:], f