加权随机森林

我打算根据随机森林法进行预测。一般来说，随机森林考虑所有的数据点相等，并基于此做出预测，但是我想为我的一些数据点分配更多的权重。更清楚的是，对于每个数据点我都有权重，因此我希望RF更偏重于更重的数据点。加权随机森林

我认为有办法增加用RF选择数据点的概率。即当RF对更多的权重进行采样时，有更多机会进行选择，并且最可能影响预测结果。但是，我不知道如何使用它？它是否已经存在于RF pyhton/r中？

感谢，阿米尔

2017-03-01 Amir

-2

你可以用sklearn.emsemble.RandomForestClassifier做到这一点。设置参数class_weight"balanced"或您的自定义词典。

clf = RandomForestClassifier(n_estimators=100, class_weight="balanced")

见official documents如果您想了解更多信息。

2017-07-09 08:58:42 Hiroyuki

问题是要求每个数据点的权重，而不是每个类的权重 –

回答