dummy-variable

    0热度

    1回答

    我正在开发一个向量自回归模型(VAR)时间序列模型在R模型规范包括所谓的内生变量的矩阵(xts类)“endog,”和外生变量的矩阵(也xts类)被称为“exog “。该数据是季节性的,我想季节性预测,所以我还指定“季= 12”,因为数据是每月。所以我的R代码执行var模型是: fit <- var(endog, p = 1, season = 12, type = 'const', exogen

    0热度

    2回答

    我对R很新,我试图创建一些新的变量。基本上我的数据集中有个人的母亲身份是变量(即如果两个人有同一个母亲,这个变量的值将是相同的)。 保持简单开始,让我们说我想创建一个虚拟变量= 1,如果两个人是兄弟姐妹。我尝试过使用: dummy <- as.numeric(duplicated(Identifiers_age$MPUBID) = TRUE) 但是我得到的矢量只有一个兄弟姐妹中的一个。我该怎么

    21热度

    1回答

    我正在学习将机器学习分类器的分类变量转换为数字的不同方法。我遇到了pd.get_dummies方法和sklearn.preprocessing.OneHotEncoder(),我想看看它们在性能和使用方面的差异。 我在https://xgdgsc.wordpress.com/2015/03/20/note-on-using-onehotencoder-in-scikit-learn-to-work

    0热度

    2回答

    这是我第一次问这里。 我只生成了斜坡虚拟变量(没有截距虚拟)。 但是,如果我将虚拟变量乘以自变量,如下所示, 表示斜坡虚拟和截距虚拟结果。 我想仅合并斜坡假人并排除截距假人。 我会感谢您的帮助。 最好成绩, yjkim reg <- lm(year ~ as.factor(age)*log(v1269)) Call: lm(formula = year ~ as.factor(age) * l

    0热度

    4回答

    如何在Python中创建二进制虚拟变量,当人员的工资低于工资水平中值时,其值为0,否则设置为1?当薪水高于或低于这个水平时,我不明白该怎么做。 我想这 df['Salary'] = (df['Salary'] > df['Salary'].median()) & (df['Salary'] < df['Salary'].median()) 但没有输出。 在此之前,我尝试这样做: df['Sal

    0热度

    1回答

    我有一个带有ID变量和另一个分类变量的DataFrame。我想用get_dummies从分类变量中创建虚拟变量。 dum = pd.get_dummies(df) 但是,这使ID变量消失。我后来需要这个ID变量来合并到其他数据集。 有没有办法保留其他变量。在get_dummies的文档中我找不到任何东西。谢谢!

    2热度

    3回答

    我的数据集看起来像这样 ID YOB ATT94 GRADE94 ATT96 GRADE96 ATT 96 ..... 1 1975 1 12 0 NA 2 1985 1 3 1 5 3 1977 0 NA 0 NA 4 ...... (与ATTXX虚拟变种在一年XX,GRADEXX学校表示出勤表示班次) 我试图创建一个虚拟变量,如果一个人在19/20岁时上学,

    0热度

    1回答

    我希望这个问题不是题目。 我知道如何在R中编写一个虚拟变量,但是,我想知道是否可以在Excel中创建它。比方说,我有一个颜色变量下的3种颜色(红色,蓝色,黄色)列表。 R会将其作为3个级别的因素导入。 现在,如果我想在Excel中做到这一点,我可以做出3个新的预测变量(而不是颜色,现在变成红色,蓝色和黄色),如果它是红色,则置1红色,否则为0上?或者R会继续将其解释为3个独立因素,每个因素有2个等

    0热度

    1回答

    我正在使用长格式的纵向调查,并且我正在尝试创建一个虚拟变量,用于如果个人在大学年龄之前没有获得大学学位25.我的数据看起来是这样的: ID CYRB VAR VALUE 1 1983 DEG98 1 1 1983 DEG00 1 1 1983 DEG02 1 1 1983 DEG04 0 2 1979 DEG08 0 2 1979 DEG00 0 2 1979 DEG02 1 2

    0热度

    1回答

    组 内按组编码为一个变量的值的伪变量I具有CASE_ID(x和y和z),一组多个日期(包括重复日期)为每个CASE_ID中的数据集,和可变VAR。我想的基团,由此,如果VAR =在某些具体的日期,则DUMMYVAR = 1对应于CASE_ID所有观察“C”为CASE_ID X X上与该日期内创建由组虚拟变量DUMMYVAR。 我相信,一个经典2XDOW是这里的关键,但这是利用SAS,并且无法获得这