假设我们有一个这样的数据帧: dat <- data.frame(
a = rnorm(1000),
b = 1/(rnorm(1000))^2,
c = 1/rnorm(1000),
d = as.factor(sample(c(0, 1, 2), 1000, replace=TRUE)),
e = as.factor(sample(c('X',
我在sci-kit学习中构建了一个线性回归模型,并将输入作为sci-kit学习管道中的预处理步骤进行缩放。有什么办法可以避免缩放二进制列吗?发生的是这些列与其他列进行缩放,导致值集中在0左右,而不是0或1,所以我得到的值如[-0.6,0.3],这导致输入值为0影响我的线性模型中的预测。 Basic代码来说明: >>> import numpy as np
>>> from sklearn.pip