gam

0热度

1回答

我在mgcv使用gam拟合模型 m <- gam(y ~ s(x) + s(Group, bs = "re")) 然而，这使得协方差矩阵 vcov(m) 非 - 正确的。此外，估计的s(x)只是一条直线。现在，除去s(x)部分修复vcov问题，并移除s(Group)还修复了这些问题，然后估计曲线s(x)是不是一条直线。有人知道为什么发生这种情况，以及如何解决它？这样我可以同时包括s(x

1热度

1回答

GAMS在R：计算各个方面

的贡献说我有一个GAM与mgcv包的gam函数来计算R上。我能得到的模型给定数据集的预测值如下： # Load data data("mtcars") # Fit model g <- gam(mpg ~ s(disp, k = 3) + s(hp, k = 3), data = mtcars) # Get values for given data set predict(g)

0热度

1回答

用过多的杠杆作用去除数据点gam fit

我跟一位统计学家问他，我如何识别和删除对gam（广义加法模型）有太大影响的点。他告诉我，我可以根据影响/投影/帽子矩阵做到这一点。我也看到@Gavin Simpson有same idea。不幸的是，我不知道如何在r实践中做到这一点。我可以通过函数提取gam的影响矩阵，但是我不知道如何在影响矩阵和原始数据之间建立连接，以知道应该删除哪些原始数据。有谁知道如何根据影响矩阵去除太多杠杆的数据点

1热度

1回答

mgcv：绘制因子'由'光滑

我想绘制出生体重称为“NO2”参数的样条效应，但我想要四个四分位数的4个图。我目前的代码只给出一个图表，请你帮我弄清楚问题所在？您可以在最后看到代码，model_1_F1_spline针对不同的参数进行了调整，但我的问题是关于F1_quartile。当我通过F1_quartile调整NO2时，它包含四个四分位数的结果，但我不知道如何提取这些结果并绘制4个图。这里是一个重复的例子： structu

0热度

1回答

R的gamm模型

我正在尝试将我的模型改编为gamm（我在lmer中使用了该模型）。我以前的公式是 b <- lmer(metric1~a+b+c+d+e+f+g+h+i+(1|X) + (1|Y), data = dataset) 我试图适应这个公式来建模与gamm。但我现在还不知道如何。我的目的是找到简化的模型。任何想法或例子，我将不胜感激。

2热度

1回答

mgcv：修复GAMM中的平滑参数和模型嵌套的有效性

我目前正在尝试对来自mgcv包的协变量x（Age）和性别0-1变量与gamm之间的交互进行建模。在为每个性别指定一个主要模型（让我们称之为M0）之后，我想测试一个更简单的假设，即性别之间的差异是线性的（而不是任意平滑的）。我有以下两个问题：当试图鸟巢模型正确，我想从M0走出了0性别流畅平滑参数，并在简单的模型规范使用它。但我得到了以下错误消息：错误gamm.setup（GP，pterms =

3热度

1回答

自定义链接功能适用于GLM但不mgcv GAM

道歉，如果答案是显而易见的，但我花了相当长的一段时间，试图在mgcv.gam 总之使用自定义链接功能，我想用从包psyphy（我想用psyphy.probit_2asym，我把它叫做custom_link）改性概率链接我可以创建此链接{统计}家庭对象和的“家庭”的说法用它GLM。 m <- glm(y~x, family=binomial(link=custom_link), ...) 为{m

2热度

1回答

为什么无法在gamm中找到对象，但它在lm中工作？

我与写调用使用get() 假设我有这个数据帧的变量的R功能挣扎： mydat = data.frame(y = rnorm(100), x = rnorm(100), day = sample(90:260, 100, replace = T), r1 = sample(seq(2008,2015,1), 100, replace = T),

0热度

1回答

使用Proc Logistic/Proc GAM

在我的数据集中，用不同范围表示的变量，比如说，Female_Age_Band被给出为15-20,20-25,25-30，... &等等。但问题出在哪里数据不可用，特定观察标记为“不可用”，这使得sas将该字段作为字符读取。所以我认为这将使得在逻辑回归中很难调用这个变量。此外，还有一些分类字段有3个不同的指标0，但即使这些字段也有“不可用”标签。在技术上无法取代零，因为零可能是一个有效的值。有人可

2热度

1回答

为什么mgcv中的bam对于某些数据很慢？

我在mgcv中使用bam函数在多个数据集上拟合了相同的广义相加模型。虽然对于我的大部分数据集合，合适的时间在10到20分钟之内完成。对于少数数据集，运行需要超过10个小时才能完成。在缓慢的情况之间我找不到任何相似之处，最终的合适既不特别好也不坏，也不包含任何明显的异常值。我怎样才能弄清楚为什么这些情况下适合度太慢？我怎么能够加速这些？我的模型包含两个光滑项（使用循环三次样条基）和一些附加的数值