2017-03-01 357 views
1

我打算根据随机森林法进行预测。一般来说,随机森林考虑所有的数据点相等,并基于此做出预测,但是我想为我的一些数据点分配更多的权重。更清楚的是,对于每个数据点我都有权重,因此我希望RF更偏重于更重的数据点。加权随机森林

我认为有办法增加用RF选择数据点的概率。即当RF对更多的权重进行采样时,有更多机会进行选择,并且最可能影响预测结果。但是,我不知道如何使用它?它是否已经存在于RF pyhton/r中?

感谢, 阿米尔

回答

-2

你可以用sklearn.emsemble.RandomForestClassifier做到这一点。 设置参数class_weight"balanced"或您的自定义词典。

clf = RandomForestClassifier(n_estimators=100, class_weight="balanced") 

official documents如果您想了解更多信息。

+0

问题是要求每个数据点的权重,而不是每个类的权重 –