如何在添加新点时避免重复的线性回归过程

我知道如何做一组N个样本的回归。但是，我的项目是分别对第2,3,4 ... k，k + 1，... N个样本进行线性回归。添加新样本时，是否有更快的方法可以使用以前的结果（或中间结果）来解决回归问题？谢谢。如何在添加新点时避免重复的线性回归过程

2016-03-06 daydayup

在近似直线的线性最小二乘法系数被使用这些公式计算：

a = (N * Sum(Xi*Yi) - Sum(Xi)*Sum(Yi))/(n * Sum(Xi^2) - (Sum(Xi))^2) 
b = (Sum(Yi) - a * Sum(Xi))/N

所以可以存储第N的值求和

Sum(Xi*Yi) 
Sum(Xi) 
Sum(Yi) 
Sum(Xi^2)

和在（N + 1更新它们）第一步。

Sum(Xi)[N+1] = Sum(Xi)[N] + X(N+1) 
Sum(Xi*Yi)[N+1] = Sum(Xi*Yi)[N] + X(N+1)*Y(N+1)

等等，并计算新的系数值。

注意：此类算法被称为“正在运行”或“在线” - 请参阅analog for std deviation

2016-03-06 03:43:51 MBo

回答