dummy-variable

    -1热度

    1回答

    假设我有一个分类变量,例如表格中的国家/地区列。 如何快速添加每个类别的虚拟变量 - WITH A NAME NAME? 所以,如果列是针对国家的,那么这个人是否居住在美国的变量将被称为美国而不是country16什么的。

    1热度

    1回答

    我对编程颇为陌生,我无法在任何地方找到它。基本上,我的一个变量的范围是0到200000,我试图用pd.get_dummies为0和> 0的值创建一个虚拟模型,但我无法弄清楚,有人能帮我做这个吗?谢谢!

    0热度

    1回答

    ,我不知道我是否应该列入各级当我创建从一个列表中的因素: random_merge_patients$MedCond <-factor(sort(random_merge_patients[[35]])) 因子的例子看起来是这样的: [6589] "wt loss ftt arthritis anemia of chronic disease mild cognitive impairment

    0热度

    1回答

    如果变量名称包含任何短语“idx”,我想创建一个等于1的新变量created_idx_var, ,“Idx”,“indx”,“Indx”,“index”,“Index”,“etf”,“ETF”或变量索引是否为“是”。 我刚开始学习R.我的第一步是消除数据集并只保留股票基金。然后,我想创建一个标志,看看基金是否是指数基金。我在网上搜索,但找不到任何东西。 一些样本数据: enter image de

    1热度

    1回答

    我有这样一个数据帧: date sales company country 16/03/2012 3000 H&M US 13/04/2012 2300 H&M US 26/03/2012 1230 H&M FR 13/04/2012 1300 H&M FR 23/03/2012 2230 H&M IT 19/04/2012 1100 H&M

    0热度

    1回答

    我有一个有多个因素的数据库。我想迭代每个变量的每个因子的回归,但对于整个数据库。例如: for (i in unique(db$Product)) { for (j in unique(db$Super)) { for (c in unique(db$Category)) { db$prueba <- lm(prueba ~ 0 + as.factor(Super)[j] *

    0热度

    1回答

    我想创建虚拟变量为R.几个不同的栏目,我可以用代码中的变量残疾做到这一点: Disability <- model.matrix(~ Disability - 1, transform(Dev_Mod, Disability = factor(paste(Disability, sep = "_")))) 因为我要运行这个各种变量的代码多次我宁愿为此创建功能,所以我写了下面的

    1热度

    1回答

    在我的数据框中,我有一个分类变量,我想将其转换为虚拟变量。然而,该塔具有由逗号分隔的多个值: 0 'a' 1 'a,b,c' 2 'a,b,d' 3 'd' 4 'c,d' 最后,我想为每一个可能的离散值二进制列;换句话说,最终列数等于原始列中唯一值的数量。我想我必须使用split()来获得每个单独的值,但不知道以后要做什么。任何提示非常感谢! 编辑:额外的扭曲。列有空值。并在回应评论

    0热度

    1回答

    我必须为可能有16个值(0-15)的列创建虚拟变量,但是当我基于它创建虚拟变量时,不需要全部16个值: my_column 0 3 1 4 2 7 3 1 4 9 我希望我的虚拟变量有16列,或者更多 - 任何预先固定由我一个值,并在列名称中的数字对应于my_column价值,但如果my_column只有,比方说,从16个可能值中的5个值,方法pd.get_dummies将只创建5列

    0热度

    2回答

    我有一个双重索引(日期,时间)的数据框,并且如果索引日属于假期列表,则希望创建等于一个新列的“假日” 。 我喜欢的类型DatetimeIndex的假期表: holidays = ['2017-09-11', '2017-12-24'] 我原来的数据帧: Visitor Date Time 2017-09-11 4:45 0 5