我现在的目标类组成: 坏:3126好:25038如何平衡1:R中与SMOTE 1
所以我想坏(少数)实例的个数等于很好的例子数(1:1)。 所以不好的需要增加〜8倍(额外的21912 SMOTEd实例),而不是增加大多数(好)。我正在尝试的代码不会保持好的数量不变。
代码我曾尝试:
实施例1:
library(DMwR)
smoted_data <- SMOTE(targetclass~., data, perc.over=700, perc.under=0, k=5, learner=NULL)
实施例1的输出: 为:25008良好:0
实施例2:
smoted_data <- SMOTE(targetclass~., data, perc.over=700, k=5, learner=NULL)
实施例2输出: 不好:25008好:43764
例3:
smoted_data <- SMOTE(targetclass~., data, perc.over=700, perc.under=100, k=5, learner=NULL)
例3输出: 坏:25008好:21882