sse

    0热度

    1回答

    我必须在我的图像的每个点上应用一个变换矩阵来获得新的点坐标。 为此,我创建了一个自定义Matrix3by3类,其中包含大小为9的浮点数组。 到矩阵应用到每个点,首先,我创造了这个功能: constexpr auto apply_matrix(const Matrix3by3 & m, const Vec2i & p) -> Vec2f { const auto x = m.at(0,

    7热度

    1回答

    TEST.CPP: #include <iostream> using namespace std; int main() { double pi = 3.14; cout << "pi:"<< pi << endl; } 当与g++ -mno-sse test.cpp编译上的cygwin 64位,输出为: PI:0 但是,如果使用g++ test.cpp编译,它

    1热度

    1回答

    条件语句我想为我的游戏做了一些计算,我试图来计算两个点之间的距离。实质上,我使用圆的方程来查看点是否在我定义的半径内。 (x - x1)^2 + (y - y1)^2 <= r^2 我的问题是:我如何用SSE评估条件语句并解释结果?到目前为止,我有这个: float distSqr4 = (pow(x4 - k->getPosition().x, 2) + pow(y4 - k->getPos

    1热度

    3回答

    acos(double)给出了x64和X32的Visual Studio不同的结果。 printf("%.30g\n", double(acosl(0.49990774364240564))); printf("%.30g\n", acos(0.49990774364240564)); 在x64 :1.0473040763868076 上X32:1.0473040763868078 上lin

    0热度

    1回答

    考虑下面的代码: // Thin/POD struct struct Data { __m256d a; __m256d b; }; // Thick base class class Base { // ... }; // Thick derived class class Derived : public Base { Data data; //

    2热度

    2回答

    我有以下代码(the xorshift128+ code from Wikipedia修改为使用向量类型): #include <immintrin.h> #include <climits> __v8si rand_si() { static auto s0 = __v4du{4, 8, 15, 16}, s1 = __v4du{23, 34, 42, 69};

    0热度

    2回答

    GCC和Clang编译器似乎使用了一些黑暗魔法。 C代码只是否定了双精度值,但汇编器指令涉及位方式XOR和指令指针。有人可以解释发生了什么,为什么它是最佳解决方案。谢谢。 void function(double *a, double *b) { *a = -(*b); // This line. } 将所得的汇编程序指令: test.c的内容 (gcc) 00000000000

    1热度

    1回答

    我正在尝试使用SSE来进行矩阵乘法。我已经为4x4矩阵编写了一个简单的程序。一切似乎都很好,但是当我打印结果时,它的一些垃圾值。请帮忙弄清楚问题。其次,程序在我释放内存时停止工作,而不是程序的正确结束。 #include <stdlib.h> #include <stdio.h> #include <time.h> #include <float.h> #include <xmmintri

    0热度

    1回答

    我有一个瓶应用中提取数据,然后将其变换的数据和这些结果然后上传到数据回购。我想要“登录”到Web UI的这些系列步骤,并且如果需要,还要记录警告。 在同一瓶的应用,我实现了SSE(服务器发送事件)和它的作品,但我一直没能“更新”的事件,以反映应用程序的状态。有人能指出我如何能够在不断更新浏览器的SSE和正在运行的应用程序之间“共享”数据,以便让用户更新数据处理过程?或者,也许是另一种方法?所有想法

    3热度

    1回答

    在我的项目中,我使用Eigen3.3库来计算6x6矩阵。我决定调查AVX指令是否真的让我对SSE有任何加速。我的CPU不支持两组: model name : Intel(R) Xeon(R) CPU E5-1607 v2 @ 3.00GHz flags : ... sse sse2 ... ssse3 ... sse4_1 sse4_2 ... avx ... 所以,我编译gcc4.8