intel-mkl

    0热度

    1回答

    前段时间,我在python 3.5中开发了一个tool,它目前只使用scipy的不同进化来完成它的任务。出于某些原因,我必须更改我的机器上的设置,并切换到在虚拟环境中使用python。 我现在规格: 赢得10 64位 使用PIP 9.0.1 numpy的1.12.1 + MKL SciPy的0.19.0 蟒蛇3.6.1 我有一个不同的环境使用Python 2.7飞到其他地方。 现在我的问题....

    1热度

    1回答

    我有不同的结果试图计算用于2D数据的Forward Fourie变换。 MATLAB,列表: fft2([25.6798, 26.0815, 29.0069; 33.5761 37.123 38.4696; 38.6358 38.0078 37.649]) Matlab的结果:低于3×3矩阵 简单测试例子 ans = 1.0e+02 * 3.0423 + 0.0000i -

    2热度

    2回答

    Python 3.5.2 |Anaconda custom (64-bit)| (default, Jul 2 2016, 17:53:06) [GCC 4.4.7 20120313 (Red Hat 4.4.7-1)] on linux Type "help", "copyright", "credits" or "license" for more information. >>> fr

    0热度

    1回答

    dll在VBA中正常工作所需的stdcall要求仅适用于32位dll。在64位dll中,我认为只有一个调用约定,所以理论上我应该能够从mkl_rt.dll中声明函数。 而事实上,与64位OpenBLAS(libopenbas.dll)我能够做一个呼叫申报一个FORTRAN BLAS函数(不cblas),它工作正常: Public Declare PtrSafe Sub dgemm Lib "lib

    0热度

    1回答

    我试图使用本征库的MKL库链接(ICC版本17.0.4)与代码: #define EIGEN_USE_MKL_ALL #define lapack_complex_float std::complex<float> #define lapack_complex_double std::complex<double> #include <iostream> #include <Eigen/

    0热度

    1回答

    我开发了一个R包,它通过Rcpp和RcppEigen调用C++代码。我Makevars.win看起来像这样(枚举是指我的问题) CXX_STD = CXX11 PKG_CPPFLAGS = -fopenmp -O3 -Wall -ftree-矢量化-march =本地-mavx - MFMA PKG_CXXFLAGS + = $(SHLIB_OPENMP_CXXFLAGS) PKG_LIBS =

    0热度

    1回答

    我已经安装python 3.5.2,通过官方安装程序发现here,我克隆了numpy和scipy(请参阅here)。我安装了英特尔平行工作室2017,这样我就拥有了英特尔版本的blas和lapack(它们位于数学核心库(MKL)),我知道这些是构建numpy和scipy所必需的(我是否错过其他需要的东西? ),我想从源代码构建numpy和scipy,而不使用anaconda或wheel或其他。我通

    0热度

    1回答

    我试图用MKL cblas_dgemm来计算矩阵的矩阵乘法。 据我所知,lda,ldb,ldc应该是简单行主矩阵的列数。我试图做以下事情: double a[3 * 2] = { 1,2,3,4,5,6 }; // 3 x 2 matrix double b[2 * 4] = { 1,2,3,4,5,6,7,8 }; // 2 x 4 matrix double c[3 * 4] = { 0

    0热度

    1回答

    我正在尝试在ABAQUS UMAT中包含英特尔数学核心函数库的in-build子例程。 我包括“mkl.fi”,但它显示如下所示的误差(这是ABAQUS产生的作业文件): Abaqus JOB Job-1 Abaqus 6.13-1 Begin Compiling Abaqus/Standard User Subroutines 3/8/2017 6:14:23 PM Intel(R

    0热度

    1回答

    我的目标是找到mxn大小的输入矩阵的特征值和向量。因为它的矩形矩阵中,通过执行一个转置然后矩阵乘法源矩阵转换的相同方对称矩阵。 之后,我使用英特尔MKL库来确定特征值和方形对称矩阵的向量。不幸的是,对于1000000 x 100000的矩形对称矩阵大小,所需的时间约为35至40秒,这不适合我的应用。 提高性能的任何建议都会非常有帮助。 在此先感谢