linear-regression

    0热度

    1回答

    我有一个多元回归模型的训练,现在我想用它来预测。 读documents据我所知,输入是标记的矢量和输出是与元组数据集[inputValue的,PredictValue],是吗? 创建我的标记矢量: val mapped = data.map {x => new org.apache.flink.ml.common.LabeledVector (x._4, org.apache.flink.ml.m

    0热度

    1回答

    我想用简单的tf.contrib.learn.LinearRegressor开始使用TensorFlow。我的数据集是一个时间序列,我希望使用T-n, ..., T-1作为特征的步骤以及T-0作为标签。所有的值都是浮点数,所以当然我想我会把每个时间步转换为real_valued_column特性。 但是,这些列具有dimension=属性,并且在TF网站上的Iris数据集的示例中,具有四维的单列作

    1热度

    2回答

    我有上(年,月)多索引为这里看到的时间序列数据: print(df.index) print(df) MultiIndex(levels=[[2016, 2017], [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]], labels=[[0, 0, 0, 0, 0, 0, 0, 0], [2, 3, 4, 5, 6, 7, 8, 9]],

    0热度

    1回答

    我在网上发现这个问题。有人可以详细解释一下,为什么使用OLS更好?仅仅是因为样本数量不够?另外,为什么不使用全部1000个样本来估计先前的分布? 我们有1000个随机抽样的数据点。目标是尝试构建一个回归模型,其中包含来自k个回归因子 变量的一个响应变量。哪个更好? 1.(贝叶斯回归)使用第一个 500个样本来估计假设的先验分布的参数,然后使用最后的500个样本更新 之前的后验分布,后验分布用于 最

    1热度

    1回答

    我使用glm与dredge在MuMIn包。但现在,因为我的数据很大,我使用biglm包中的bigglm。现在我该如何做模型选择,因为dredge不适用于bigglm?是否有另一个我可以用来实现这个目标的软件包? 在施加上bigglm的dredge我收到以下错误: Error in nobs.default(global.model) : no 'nobs' method is available

    -1热度

    1回答

    我试图训练Python中的线性回归模型(使用sklearn),但斜率等于零,即恒定模型h(x)= b(h:model,b:截距)。 你知道sklearn中的任何方法来完成这个吗? (我对LinearRegression非常熟悉,但我无法在那里找到答案)。 谢谢!

    24热度

    1回答

    我已经在已弃用的stats/ols模块中使用了熊猫的MovingOLS类(源here)。不幸的是,它完全被熊猫0.20吞噬。 在我看来,如何以高效的方式运行滚动OLS回归的问题已被多次提出(例如here),但是表达方式有点宽泛,没有一个很好的答案。 这里是我的问题: 我怎样才能最好地模拟大熊猫MovingOLS的基本框架?这个类最吸引人的特点是能够将多个方法/属性视为不同的时间序列 - 即,系数,

    1热度

    4回答

    我有一个名为repay的数据框,并且我为变量名称创建了一个我感兴趣的变量名称的变量。 variables<-names(repay)[22:36] 我想写一个for循环,对变量中的每个变量做一些单变量分析。例如: for (i in 1:length(variables)) { model<-glm(Successful~ variables[i] ,data=repay ,famil

    1热度

    2回答

    多项式回归曲线我是新来sklearn和我有一个适当的简单的任务:给定的15点的散点图,我需要 把他们的11作为我的训练样本', 通过这11个点拟合3次多项式曲线; 在15个点上画出得到的多项式曲线。 但是我陷入了第二步。 这是数据图: %matplotlib notebook import numpy as np from sklearn.model_selection import tra

    1热度

    1回答

    我已经编写了一个多线性回归模型的代码。但是当我使用results.summary()。蟒蛇吐出这整个事情了 if i >1: xxx = sm.add_constant(xxx) results = sm.OLS(y_variable_holder, xxx).fit() print (results.summary()) OLS Regression R