openmp

    -1热度

    1回答

    我已经编写了一个调用C函数的Python脚本,该脚本使用OpenMP并行化(使用ctypes-wrapper传递从Python到C函数的变量)。 C函数可以正确地生成所需的输出。但是,我在Python代码的最后得到了一个分段错误。我怀疑它与OpenMP产生的线程有关,因为当OpenMP被禁用时seg-fault不会发生。 在代码的Python端(它调用外部C-功能)我有: ... C_Func

    3热度

    1回答

    随着gcc 7.1的发布,我们现在可以配置gcc for openmp 4.5,卸载到Nvidia PTX GPGPU。这就是他们在发布说明(大约)中所说的。 所以我的问题是,是否有任何特殊的标志来激活此配置时,编译openmp 4.5目标nvidia设备?

    0热度

    1回答

    我目前正试图找到一种快速和可靠的方式来并行化一组循环,如果条件,我需要保存在内部循环的结果。代码应该经过3D网格中的大量点。对于本卷中的某些点,我必须检查另一个条件(检查一个角度),如果满足这个条件,我必须计算一个密度。 迄今为止最快的方法是在所有for循环之外的#pragma omp parallel for private (x,y,z) collapse(3)或用于最内循环(phiInd)的

    1热度

    1回答

    我一直在Eigen 3.2中使用ConjugateGradient解算器,并决定尝试升级到Eigen 3.3.3,希望从新的多线程特性中受益。 不幸的是,当我使用GCC 4.8.4启用-fopenmp时,解算器似乎较慢(〜10%)。看着xosview,我看到正在使用的所有8个CPU,但性能更慢...... 一些测试后,我发现,如果我禁用编译器优化(使用-O0代替-O3),然后-fopenmp并加快

    0热度

    1回答

    我想在Fedora 25上从源代码编译LLVM,Clang,OpenMP(来自LLVM项目)和libC++(libcxx)。默认GCC 6.3正在用于构建它们。我发出 cmake ../llvm -DCMAKE_BUILD_TYPE=Release -DLLVM_TARGETS_TO_BUILD="X86" 一切似乎顺利,直到我得到 -- Performing Test LIBOMPTARGE

    5热度

    3回答

    g++ -fopenmp main.cpp抱怨未定义的引用为std::vector。如何解决这个问题? 我在Ubuntu上安装了libomp-dev软件包。 的main.cpp #include<vector> #include<iostream> template<typename T, typename A> T recursiveSumBody(std::vector<T, A> &

    0热度

    1回答

    我正在研究使用Omp的'C'并行编程。在我的模块阵列求和parallel.c我包括第一,作为请求,文件hpc.h是在我的C文件相同的文件夹,并包含以下代码: /*This header file provides a function double hpc_gettime() that returns the elaps ed time (in seconds) since "the epoch

    0热度

    2回答

    auto t1 = chrono::steady_clock::now(); #pragma omp parallel { for(int i=0;i<n;i++) { #pragma omp for collapse(2) for(int j=0;j<n;j++) { for(int k=0

    2热度

    2回答

    我使用OpenMP和C工作了大学交付上,我试图执行下面的代码,我想要做的唯一的事情就是看每个部分在每一个不同的线程是如何工作的: #include <omp.h> #include <stdio.h> int main() { int id, np; printf("Max threads number: %d\n",omp_get_max_threads

    2热度

    1回答

    这个问题涉及上英特尔至强E5-2650v4处理器的流三合会结果的解释。该处理器有2个插槽,每个插槽有12个内核。每个插座上的共享L3高速缓存是30 MB,即30/12 = 2.5 MB/core。因此,在OpenMP版本的STREAM基准阵列大小= 4 * ((30+30) * 1024 * 1024)/8 = 31,457,280中的双元素大约是32,000,000(3200万)的双元素。我使用