2012-11-04 74 views
0

我有一个状态 - >行为对的数据集,(s,a),其中每个s定义了a的可能选择的概率分布,并且每个a从该概率分布中采样。我想为这个数据集训练一个分类器,而不是学习预测最大可能性,它会预测从中抽取的分布。例如,如果您正在播放迭代摇滚剪刀,则您的状态可能就是您之前做出的移动以及一个∈{Rock,Paper,Scissors},其中之前的状态会降低选择的概率该行动再次。那么我的数据集将是这样的:scikit学习随机森林的概率分布?

PreviousAction,Chosen 
Rock,Paper 
Paper,Rock 
Rock,Scissors 
Scissors,Paper 
Paper,Paper 
... 

是否可以学习在标签概率分布在scikit学习随机森林?

回答

1

是的。训练RandomForestClassifier使用fit(它期望标签,而不是概率分布,作为其参数y),然后使用predict_proba预测。