我想知道是否可以得到一些问题的帮助。嘈杂的数据集的多项式回归
我正在为我的一个前实验室创建一个工具,它使用来自基于物理机器(大量噪音)的数据,结果为简单的x,y坐标。我想确定数据集的局部最大值,但是,由于该组中存在一堆噪声,因此您不能只检查点之间的斜率以确定峰值。
为了解决这个问题,我考虑使用多项式回归来有点“平滑”数据集,然后从结果模型中确定局部最大值。
我已经通过这个链接 http://scikit-learn.org/stable/auto_examples/linear_model/plot_polynomial_interpolation.html,但它只告诉你如何创建一个非常合适的模型。它没有告诉你是否有一个综合度量标准来衡量哪个是最好的模型。我应该通过Chi平方吗?或者还有其他一些更好的工具或集成到scikit-learn工具包中的指标?
感谢先进!
我会建议这种问题的最大熵算法。 – Mehno