linear-regression

    1热度

    1回答

    我想有四个预测我在哪里可以自由指定 整体解释模型 所有标准化回归系数的大小的变化来模拟数据进行多元线性回归 的预测变量彼​​此相关的程度 我到达了满足前两点的解决方案,但是基于所有ind自变量彼此无关(请参阅下面的代码)。为了得到标准化的回归系数,我从平均值= 0和方差= 1的总体变量中抽样。 # Specify population variance/covariance of four pre

    0热度

    1回答

    回归每个因变量(dep_var)对独立变量(ind_var) 我试图对一个独立变量一次一个执行针对多个因变量线性回归。 当存在缺失观察(NA),其全部行不用于该特定消退。 我已经通过循环/遍历每个因变量列来完成它。 fit = list() for(i in 1 : 2) { fit[[i]] = lm(mydf$Ind_Var[ which(!is.na(mydf[ , (2+i)

    2热度

    1回答

    我试图解决方形的线性系统Xc=y。我知道解决这个的方法是: 使用逆c=<X^-1,y> 用高斯消元法 使用伪逆 似乎只要我可以告诉大家,这些别不符合我认为的基本事实。 首先通过拟合30次多项式到频率为5的余弦来生成真值参数。所以我有y_truth = X*c_truth。 然后我检查,如果上述三种方法相匹配的真相 我尝试过,但似乎该方法不匹配,我不明白为什么这应该是这样的。 我公司生产的完全可运行

    0热度

    1回答

    根据我有限的知识,线性函数只有两个变量来定义它,即x和y。 然而,如每多元线性回归, h(x)=(theta transpose vector)*(x vector) where theta transpose vector = (n+1)x1 vector of parameters x vector = input variables x0, x1, x2 ....., xn

    2热度

    2回答

    我想基于JavaScript中的过去利润来对未来的组织进行简单的利润预测。我的数据集的日期是x轴,利润是y轴。我是数据分析的新手,基本上我没有知识,我不确定哪种预测算法最适合。 我做了一些研究here和here,发现我实际上可以使用线性回归预测算法。但是,从这些例子中,我只看到预测算法只是根据数据绘制一条直线来找出回归值,并且它根本没有预测任何未来值。 我不知道上面提到的算法是否适用于我的情况?

    0热度

    1回答

    我试图弄清楚为什么LinearRegressionWithSGD不适用于Spark的ParamGridBuilder。从火花文档: lr = LinearRegression(maxIter=10) paramGrid = ParamGridBuilder()\ .addGrid(lr.regParam, [0.1, 0.01]) \ .addGrid(lr.fitIntercept, [F

    2热度

    1回答

    enter image description here如何在此图中绘制线性回归线? 这里是我的代码: import numpy as np import pandas_datareader.data as web import pandas as pd import datetime import matplotlib.pyplot as plt #get adjusted close

    1热度

    1回答

    我想在Python中使用Statsmodels做一些多元线性回归,但是我一直在尝试组织我的数据时有一些心理障碍。 所以默认波士顿数据集是这样的: 而且线性回归模型的输出是这样的: 我的原始数据是空间分隔像这样: 而且我已经能够将其安排到阵列中的位置: 有谁有更多的Python的经验知道我可以以类似的方式格式化我的数据在波士顿的数据集,使我可以轻松实现我的回归模型?例如,设置对应于我的数据索引的fe

    0热度

    1回答

    我正在分析一组数据,我需要找到它的回归。数据集中的数据点数量很少(〜15),因此我决定使用强大的线性回归作业。问题在于程序选择了一些看起来不具有影响力的异常点。这里是数据的散点图,其影响用作尺寸: 点B和C(图中用红色圆圈表示)被选作异常值,而点A具有较高的影响力则不是。虽然A点并没有改变回归的总体趋势,但它基本上定义了斜率与X最高的点一样。而B点和C点只影响斜率的显着性。所以我的问题有两个部分:

    1热度

    1回答

    请注意,以前可能已经问过这个问题,但我还没有找到明确的解决方案来处理数据框。 我想在5天的后面运行滚动线性回归。 (小,所以可以在这里说明) 到目前为止,我想: rollingbeta <- rollapply(df, width=5, FUN = function(Z) { t = lm(formula=y_