2013-05-07 66 views
0

我试图用程序R中的多项式函数拟合点数据,并想知道哪个顺序最适合。我使用非线性回归模型nls(function, data, start),功能是y~a*(x+c)^b计算R中的nls()的问题

我想要做的是计算山谷填充矿床的横截面积。出于这个原因,我需要模拟底层谷底的样子。我已经有线性场景,现在想尝试一些多项式场景。

我的数据集表示谷轮廓,看起来像这样(与x_combsl是距离和y_combsl高程):

x_combsl y_combsl  
1 0.0000000 120.9095 
2 0.9904867 120.5066 
3 1.9809735 120.0947 
4 2.9714602 119.6811 
5 3.9619470 119.2492 
6 4.9524337 118.8483 
7 5.9429204 118.4866 
8 6.9334072 118.1120 
9 7.9238939 117.7750 
10 8.9143806 117.2833 
11 9.9048674 116.7698 
12 10.8953541 116.2841 
13 11.8858409 115.8285 
14 12.8763276 115.2949 
15 13.8668143 114.6750 
16 14.8573011 114.1301 
17 15.8477878 113.6537 
18 16.8382746 113.2016 
19 17.8287613 112.8163 
20 18.8192480 112.4945 
21 19.8097348 112.0304 
22 20.8002215 111.2370 
23 21.7907082 110.7463 
24 22.7811950 110.2954 
25 23.7716817 109.6715 
26 24.7621685 109.1829 
27 44.5719032 109.0435 
28 45.5623900 109.4721 
29 46.5528767 110.0491 
30 47.5433634 110.4394 
31 48.5338502 110.6832 
32 49.5243369 111.0763 
33 50.5148237 111.8376 
34 51.5053104 112.6162 
35 52.4957971 113.2467 
36 53.4862839 113.8065 
37 54.4767706 114.4694 
38 55.4672573 114.9547 
39 56.4577441 115.4724 
40 57.4482308 116.0013 
41 58.4387176 116.4606 
42 59.4292043 117.0797 
43 60.4196910 117.7074 
44 61.4101778 118.2127  
45 62.4006645 118.7544 
46 63.3911512 119.3134 
47 64.3816380 119.9159 
48 65.3721247 120.5462 
49 66.3626115 121.0418 
50 67.3530982 121.5350 
51 68.3435849 122.0184 
52 69.3340717 122.5490 
53 70.3245584 123.1162 
54 71.3150452 123.6437 

当我尝试生成模型,我得到了以下错误消息:

data<-data.frame(x_combsl, y_combsl) 

fit_nls<-nls(y_combsl~a*(x_combsl + c)^b, data=data, start=list(a=1, b=2, c=35)) 
Error in numericDeriv(form[[3]], names(ind), env) : 
    Missing value or an Infinity produced when evaluating the model 

任何想法可能会导致问题?多项式的峰值很可能在c = 35左右,所以起始参数似乎不会引起问题。可能是点的线性对齐?我用更少的数据点[24:31]尝试过,但我得到了相同的错误信息。

我对R编程不是很有经验,所以具体的答案会很棒。

+0

你或许应该给出的参数范围来估算(参见'lower'和''中描述nls'参数upper'?)。你也可能有更好的结果转换和拟合'log(y)= log(a)+ b log(x + c)'。 – Gregor 2013-05-07 18:26:36

+0

绘制您的数据后,我认为您的模型不适合数据。你可以尝试使用Levenberg-Marquardt算法(minpack.lm包中的'nlsLM'),这个算法通常比Gauss-Newton收敛得更好,但是我怀疑你会非常适合。 PS:阅读“dput”以了解如何以更好的方式共享您的数据。 – Roland 2013-05-07 18:56:30

回答

1

的几点:

  • 的曲线是大致对称的大致35,从而起始c应等于-35,不35。
  • 给定对称性b应该是偶数,2,4,6,...。
  • 该模型需要灵活地向上和向下移动,所以添加一个参数为
  • 与最后一点我们有两个线性参数,所以使用algorithm="plinear",以避免必须拿出他们的起始值。此外,我们正在修复b,所以我们现在只有c给出了一个初始值,并且我们已经确定我们将使用-35。

因此尝试以下,并用b,或许还加上运行= 2,B = 6,以及:

nls(y_combsl ~ cbind(1, (x_combsl + c)^4), data, alg = "plinear", start = list(c = -35)) 

courese我们真的现在已经下降到一个多项式,所以我们可能会在模式更改为全多项式和使用lm

lm(y_combsl ~ poly(x_combsl, 4), data)