我计算Pearson correlation(平均用户/项目评分)很多次,使用我当前的代码的表现非常糟糕:性能阵列乘法皮尔逊
public double ComputeCorrelation(double[] x, double[] y, double[] meanX, double[] meanY)
{
if (x.Length != y.Length)
throw new ArgumentException("values must be the same length");
double sumNum = 0;
double sumDenom = 0;
double denomX = 0;
double denomY = 0;
for (int a = 0; a < x.Length; a++)
{
sumNum += (x[a] - meanX[a]) * (y[a] - meanY[a]);
denomX += Math.Pow(x[a] - meanX[a], 2);
denomY += Math.Pow(y[a] - meanY[a], 2);
}
var sqrtDenomX = Math.Sqrt(denomX);
var sqrtDenomY = Math.Sqrt(denomY);
if (sqrtDenomX == 0 || sqrtDenomY == 0) return 0;
sumDenom = Math.Sqrt(denomX) * Math.Sqrt(denomY);
var correlation = sumNum/sumDenom;
return correlation;
}
我使用与MathNet.Numerics
标准Pearson相关,但这是修改标准,而且不可能使用它。有没有办法加快速度?如何优化时间复杂性?
我觉得这是更好地问这个问题在这里http://codereview.stackexchange.com/ – Sybren
我们可以通过看代码做一些假设,但我们什么不知道这些假设实际上改善了性能。你应该通过一个分析器来运行它,以真正查看导致缓慢的原因。 –