2011-10-08 100 views
1

在我的程序中 - 使用特征库 - 我需要在2D向量上操作。在我的内循环,我有以下功能:使用特征向量化表达式

static inline double eval(double x, double y, double xi, double yi) 
{ 
    const double invlen2 = 1/(x*x + y*y); 
    const double invlen4 = invlen2*invlen2; 
    const double invlen6 = invlen4*invlen2; 

    const double x2 = x*x, y2 = y*y; 
    const double x3 = x2*x, y3 = y2*y; 
    const double xi2 = xi*xi, yi2 = yi*yi; 

    return x*invlen2 + invlen4*(x2*xi + 2*x*y*yi - xi*y2) 
    + invlen6*(x3*xi2 + 3*x*y2*yi2 + 6*x2*y*xi*yi - 3*x*xi2*y2 - 2*y3*xi*yi - x3*yi2); 
} 

void f(Vector2d& out, const Vector2d& R, const Vector2d& r) 
{ 
    out.x() = eval(R.x(), R.y(), r.x(), r.y()); 
    out.y() = eval(R.y(), R.x(), r.y(), r.x()); 
} 

这种表达,虽然凌乱,似乎是一个主要候选矢量化同时作为x()y()计算遵循相同的路径。我的问题是如何与Eigen做到这一点,而无需手动下拉到组装。

回答

1

这个答案与Eigen没有任何关系,但既然你提到了手动下降到装配,我会补充这个。

您不需要使用程序集来向量化代码。有编译器内在,可以让手动矢量化无装配:

http://software.intel.com/sites/products/documentation/studio/composer/en-us/2011/compiler_c/intref_cls/common/intref_overview.htm#intref_overview

这就是说:它看起来像征已经有量化的内部支持,但它似乎并不适用于你的榜样。所以我可以看到你为什么要手动执行它。