statsmodels

    1热度

    2回答

    我正在使用statsmodels.formula.api进行线性回归。我用三个独立变量进行预测。在某些情况下,我得到负面价值,但所有产出都应该是正面的。 有什么办法可以告诉模型输出不能为负数吗? import statsmodels.formula.api as smf output1 = smf.ols(formula= 'y ~A+B+C', data= data).fit() outp

    1热度

    1回答

    我想用调查权重对调查数据进行线性回归。 调查数据是来自欧盟和每个观察的重量。 (0.4用于一个答复,1.5另一个。) 该重量被描述为: “欧洲重量,可变6,产生 欧洲共同体的代表性样品作为一个整体时在分析中使用这个变量 根据每个国家的欧洲共同体的人口 贡献调整每个国家的样本的大小“。 做我的计算我使用sklearn。 from sklearn import linear_model regr =

    2热度

    1回答

    以下代码应运行MNLogit模型并返回置信区间。它成功地返回摘要,你可以看到那里的置信区间,但是当试图通过conf_int()返回置信区间时,我得到一个ValueError:必须传递2-d输入。 import pandas as pd import statsmodels.api as sm tmp = pd.read_csv('http://surveyanalysis.org/image

    0热度

    1回答

    对于计量经济分析,我试图对巴西中央银行和政府研究机构的一些教育,健康和收入数据进行回归。 Python,pandas,statsmodels和matplotlib是我最常用于此项目的外部库。 数据格式在多个表格中,每年的行数和城市/列的状态(一些文件具有城市数据,一些具有状态数据)。 被市,年收入大熊猫数据帧的例子: 1200302 1200328 ... 1720937 1720978 1721

    0热度

    1回答

    以下代码来自 “用于数据分析的Python”,第11章,组转换和分析。 我显示每个库的版本如下。 # -*- coding: utf-8 -*- """ Created on Sun Jun 4 13:33:47 2017 "Python for Data Analysis",chp 11,group transforms and analysis. """ import numpy as

    2热度

    1回答

    对我的评价,我想跑滚动1000窗口在这个网址找到该数据集的OLS regression estimation:使用以下Python脚本 https://drive.google.com/open?id=0B2Iv8dfU4fTUa3dPYW5tejA0bzg 。 # /usr/bin/python -tt import numpy as np import matplotlib.pyplot

    0热度

    1回答

    我有来自两个组的不同样本的值的数据帧。我在这些上执行了scipy.stats.ttest,这很好,但我在这里有点担心这么多测试可能会产生多个测试错误。 我想知道如何实现MTC(多重测试校正)。我的意思是,在scipy或statsmodels中是否有一些函数可以直接执行测试,并将MTC应用于输出的p值序列,或者我可以在没有问题的p值列表上应用MTC函数? 我知道statsmodels可能包含这样的功

    0热度

    1回答

    我想从第3页的MATLAB实现paper实现经验分布函数。下面是我的Python版本。 我根据NumPy for MATLAB users documentation转换它同时又考虑到如何statsmodelsECDF from statsmodels.distributions.empirical_distribution import ECDF def ecdf_representati

    0热度

    1回答

    我试图在jupyter笔记本中使用Python 3.5中的statsmodels.api和statsmodels.regression。这是在虚拟环境中。使用OSX El Capitan。我得到的错误 AttributeError: module 'statsmodels' has no attribute 'regression' ,同样调用statsmodels.api: Attribut

    0热度

    1回答

    对于我的评估,我想针对在this link(https://drive.google.com/drive/folders/0B2Iv8dfU4fTUMVFyYTEtWXlzYkk)中找到的数据集运行滚动,例如3窗口OLS regression estimation,如以下格式所示。我的数据集中的第三列(Y)是我的真实值 - 这就是我想要预测的(估计)。 time X Y 0.000543 0