0
我知道如何做一组N个样本的回归。但是,我的项目是分别对第2,3,4 ... k,k + 1,... N个样本进行线性回归。添加新样本时,是否有更快的方法可以使用以前的结果(或中间结果)来解决回归问题?谢谢。如何在添加新点时避免重复的线性回归过程
我知道如何做一组N个样本的回归。但是,我的项目是分别对第2,3,4 ... k,k + 1,... N个样本进行线性回归。添加新样本时,是否有更快的方法可以使用以前的结果(或中间结果)来解决回归问题?谢谢。如何在添加新点时避免重复的线性回归过程
在近似直线的线性最小二乘法系数被使用这些公式计算:
a = (N * Sum(Xi*Yi) - Sum(Xi)*Sum(Yi))/(n * Sum(Xi^2) - (Sum(Xi))^2)
b = (Sum(Yi) - a * Sum(Xi))/N
所以可以存储第N的值求和
Sum(Xi*Yi)
Sum(Xi)
Sum(Yi)
Sum(Xi^2)
和在(N + 1更新它们)第一步。
Sum(Xi)[N+1] = Sum(Xi)[N] + X(N+1)
Sum(Xi*Yi)[N+1] = Sum(Xi*Yi)[N] + X(N+1)*Y(N+1)
等等,并计算新的系数值。
注意:此类算法被称为“正在运行”或“在线” - 请参阅analog for std deviation