numba-pro

    0热度

    1回答

    我一直在关注一个例子(https://github.com/ContinuumIO/numbapro-examples/blob/master/convolution/fftconvolve.py)给与fftconvolve与图像和内核,都是二维数组。在我的用例中,我想用两个1D阵列来做fftconvolve来寻找可能的匹配和延迟。我试图将示例转换为1D,但收到了几个Invalid type co

    0热度

    1回答

    我尝试用numba来使用cuda python。 代码是计算1D数组的总和如下,但我不知道如何得到一个值的结果,而不是三个值。 python3.5与numba + CUDA8.0 import os,sys,time import pandas as pd import numpy as np from numba import cuda, float32 os.environ['NUM

    4热度

    1回答

    我正在学习如何在GPU加速计算蟒从this notebook,其中一条线让我困惑: mandel_kernel[griddim, blockdim](-2.0, 1.0, -1.0, 1.0, d_image, 20) 这里,mandel_kernel是一个装饰(由cuda.jit)函数,griddim和blockdim是长度为2的元组:griddim=(32,16),blockdim=(32

    -1热度

    1回答

    我想获得数组的不同部分的总和。 我运行我的代码。并从打印的内容中发现两个问题。 PRO1: 详细介绍here。它已经解决了。也许这不是一个真正的问题。 PRO2: 在我的代码,我红粉不同的值SBUF [0,2],SBUF [1,2],SBUF [2,2]和SBUF [0,3],SBUF [1,3],sbuf [2,3]。 但是发现在cuda.syncthreads()之后,sbuf [0,2]和s

    0热度

    1回答

    两部分问题,对于任何一部分都非常感谢。我试图在AWS EB上安装Anaconda,然后是numbapro。我在.ebextensions options.config看起来是这样的: commands: 00_download_conda: command: 'wget http://repo.continuum.io/archive/Anaconda2-4.3.0-Linux-x86_64.

    1热度

    1回答

    什么是检查cuda的正确anaconda加速函数? 有了你可以使用numbapro: >>> from numbapro import check_cuda numbapro:1: ImportWarning: The numbapro package is deprecated in favour of the accelerate package. Please update your co

    0热度

    1回答

    我试图来解决单纯使用GPU优化的熵问题。因为每一次单纯的迭代都依赖于前一次迭代,所以我相信我没有办法让我的算法平行。 但是已经做了PyOpenCl和Numbapro一些研究,OpenCL的提供了一个类型的编程架构的SIMD叫。我只是想知道Numbapro会提供相同的吗? 到目前为止,我已经试过jit,autojit &矢量化的代码的一部分,但没有迹象表明性能改善。

    2热度

    1回答

    我是CUDA新手,想弄清楚PyCUDA (free)或NumbaPro CUDA Python(不是免费)对我来说是否会更好(假设图书馆的成本不是问题)。 两者似乎都要求您使用各自的Python方言。但是,PyCUDA似乎要求你在C代码中编写内核函数,这比使用NumbaPro更麻烦,而NumbaPro似乎为你做了所有的辛苦工作。 这的确是这样吗?会有明显的性能差异吗?

    0热度

    1回答

    我在GPU中用math.log计算对数,这是Supported Python features in CUDA Python之一。但失败了。 我的代码: import os,sys,time,math import pandas as pd import numpy as np from numba import cuda, float32 import os bpg = (3,1

    0热度

    1回答

    我试图用numbapro写下面一个简单的矩阵向量乘法: from numbapro import cuda from numba import * import numpy as np import math from timeit import default_timer as time m = 100000 n = 100 @cuda.jit('void(f4[:,:], f