gam

    0热度

    1回答

    我在mgcv使用gam拟合模型 m <- gam(y ~ s(x) + s(Group, bs = "re")) 然而,这使得协方差矩阵 vcov(m) 非 - 正确的。此外,估计的s(x)只是一条直线。 现在,除去s(x)部分修复vcov问题,并移除s(Group)还修复了这些问题,然后估计曲线s(x)是不是一条直线。 有人知道为什么发生这种情况,以及如何解决它?这样我可以同时包括s(x

    1热度

    1回答

    的贡献说我有一个GAM与mgcv包的gam函数来计算R上。我能得到的模型给定数据集的预测值如下: # Load data data("mtcars") # Fit model g <- gam(mpg ~ s(disp, k = 3) + s(hp, k = 3), data = mtcars) # Get values for given data set predict(g)

    0热度

    1回答

    我跟一位统计学家问他,我如何识别和删除对gam(广义加法模型)有太大影响的点。 他告诉我,我可以根据影响/投影/帽子矩阵做到这一点。我也看到@Gavin Simpson有same idea。 不幸的是,我不知道如何在r实践中做到这一点。我可以通过​​函数提取gam的影响矩阵,但是我不知道如何在影响矩阵和原始数据之间建立连接,以知道应该删除哪些原始数据。 有谁知道如何根据影响矩阵去除太多杠杆的数据点

    1热度

    1回答

    我想绘制出生体重称为“NO2”参数的样条效应,但我想要四个四分位数的4个图。我目前的代码只给出一个图表,请你帮我弄清楚问题所在?您可以在最后看到代码,model_1_F1_spline针对不同的参数进行了调整,但我的问题是关于F1_quartile。当我通过F1_quartile调整NO2时,它包含四个四分位数的结果,但我不知道如何提取这些结果并绘制4个图。 这里是一个重复的例子: structu

    0热度

    1回答

    我正在尝试将我的模型改编为gamm(我在lmer中使用了该模型)。 我以前的公式是 b <- lmer(metric1~a+b+c+d+e+f+g+h+i+(1|X) + (1|Y), data = dataset) 我试图适应这个公式来建模与gamm。但我现在还不知道如何。我的目的是找到简化的模型。 任何想法或例子,我将不胜感激。

    2热度

    1回答

    我目前正在尝试对来自mgcv包的协变量x(Age)和性别0-1变量与gamm之间的交互进行建模。在为每个性别指定一个主要模型(让我们称之为M0)之后,我想测试一个更简单的假设,即性别之间的差异是线性的(而不是任意平滑的)。我有以下两个问题: 当试图鸟巢模型正确,我想从M0走出了0性别流畅平滑参数,并在简单的模型规范使用它。但我得到了以下错误消息: 错误gamm.setup(GP,pterms =

    3热度

    1回答

    道歉,如果答案是显而易见的,但我花了相当长的一段时间,试图在mgcv.gam 总之使用自定义链接功能, 我想用从包psyphy(我想用psyphy.probit_2asym,我把它叫做custom_link)改性概率链接 我可以创建此链接{统计}家庭对象和的“家庭”的说法用它GLM。 m <- glm(y~x, family=binomial(link=custom_link), ...) 为{m

    2热度

    1回答

    我与写调用使用get() 假设我有这个数据帧的变量的R功能挣扎: mydat = data.frame(y = rnorm(100), x = rnorm(100), day = sample(90:260, 100, replace = T), r1 = sample(seq(2008,2015,1), 100, replace = T),

    0热度

    1回答

    在我的数据集中,用不同范围表示的变量,比如说,Female_Age_Band被给出为15-20,20-25,25-30,... &等等。但问题出在哪里数据不可用,特定观察标记为“不可用”,这使得sas将该字段作为字符读取。所以我认为这将使得在逻辑回归中很难调用这个变量。此外,还有一些分类字段有3个不同的指标0,但即使这些字段也有“不可用”标签。在技术上无法取代零,因为零可能是一个有效的值。 有人可

    2热度

    1回答

    我在mgcv中使用bam函数在多个数据集上拟合了相同的广义相加模型。虽然对于我的大部分数据集合,合适的时间在10到20分钟之内完成。对于少数数据集,运行需要超过10个小时才能完成。在缓慢的情况之间我找不到任何相似之处,最终的合适既不特别好也不坏,也不包含任何明显的异常值。 我怎样才能弄清楚为什么这些情况下适合度太慢?我怎么能够加速这些? 我的模型包含两个光滑项(使用循环三次样条基)和一些附加的数值