linear-regression

    1热度

    1回答

    目前,我正在使用GAM模型复制Wood(2006)关于芝加哥空气污染与死亡率之间关系的练习。 所以,我遵循他在他的书中使用的代码。该图书馆被称为“gamair”,数据框架是“芝加哥”。 我把这个(酷似书): gam(death~s(time,bs="cr",k=200)+pm10median+so2median+o3median+tmpd,data=chicago,family=poisson)

    4热度

    1回答

    我正在尝试实现一种方法,使其适合2D中一组点。 我写了下面的代码,它从两个Array(X,Y坐标) 中读取数据,并且应该用最小二乘法计算最佳拟合线的参数。 我用这里给出的公式: mathworld.wolfram - (void) linearRegressionOfUserAcceleration { double avgX = [[_accelBufferX valueForKey

    1热度

    1回答

    我知道过去有人问过类似的问题,但我的加权回归只需要系数。计算应该尽可能快。我知道ls.fit和一些Rcpp包函数是这里的选项。尽快进行加权回归的最快,最简单的方法是什么?

    3热度

    2回答

    我喜欢提取每个lm对象的系数和标准错误,并将它们组合成一个data.frame,并填入NA以填充缺失的预测变量。 set.seed(12345) x<-matrix(rnorm(1000),nrow=100,ncol=10) colnames(x)<-paste("x",1:10,sep="") df<-data.frame(y=rnorm(100),x)

    16热度

    4回答

    随着scipy.stats.linregress我对一些高度相关的x,y实验数据集进行简单的线性回归,并最初目视检查离群值的每个x,y散点图。更一般地(即以编程方式)有没有一种方法来识别和掩盖异常值?

    9热度

    1回答

    我创建了一个脚本,如下面的人做的东西我称之为“加权”回归: library(plyr) set.seed(100) temp.df <- data.frame(uid=1:200, bp=sample(x=c(100:200),size=200,replace=TRUE), age=sample(x=c(30:65),size=200,replace

    10热度

    5回答

    我试图做固定效应与R.线性回归我的数据看起来像 dte yr id v1 v2 . . . . . . . . . . . . . . . 我再决定简单地通过使yr一个因素做到这一点,使用lm: lm(v1 ~ factor(yr) + v2 - 1, data = df) 然而,这似乎耗尽内存。我在我的因素中有20个级别,而df是1400万行,这需要大约2G

    0热度

    1回答

    在R中运行多重回归之后,回归总结指示具有恒星的重要变量。在我正在研究的数据集中,有近2000个变量,由R标识的重要变量包含50多个变量。从回归总结中可以单独获得重要变量的列表吗?

    0热度

    1回答

    我正在尝试估计某些社区数据的广义最小二乘回归参数。我已经成功地做到了这一点的一组数据,但是当我尝试相同的技术参数估计为另一组,我得到了以下错误消息: Error in gnls(SF ~ a * Site_Code^b, data = data, weights = varPower(form = ~Site_Code), : Step halving factor reduced be

    1热度

    1回答

    我正在玩公式中的交互。我想知道是否有可能为两个虚拟变量之一进行交互回归。这似乎在使用lm()函数的常规线性回归中工作,但在rms包中使用ols()函数时,相同的公式会失败。有人知道为什么 这里是我的榜样 data(mtcars) mtcars$gear <- factor(mtcars$gear) regular_lm <- lm(mpg ~ wt + cyl + gear + cyl:ge