各地不断变量和Logistic回归的几个问题 -与变量Logistic回归不改变
可以说我有一个连续变量,但只有1个在整个数据集值。我知道我应该理想地消除这个变量,因为它没有预测价值。而不是手动为每个功能执行此操作,Logistic回归会自动使这些变量的系数为0吗?
如果使用这样的变量(即仅具有一个值)的Logistic回归与L1正则化,将正则迫使系数为0?
在类似的路线上,如果我有一个分类变量,我有3个级别 - 第一级跨度表示60%的数据集,第二跨度35%,第三级5%),我分裂它为训练和测试,有一个很好的机会,在测试组第三级可能不会结束,带领我们这样一个场景,我们有在测试集训练集一个价值以及其他的变量。我如何处理这种情况?正规化会自动处理这样的事情吗?
ND