0
我有一个状态 - >行为对的数据集,(s,a),其中每个s定义了a的可能选择的概率分布,并且每个a从该概率分布中采样。我想为这个数据集训练一个分类器,而不是学习预测最大可能性,它会预测从中抽取的分布。例如,如果您正在播放迭代摇滚剪刀,则您的状态可能就是您之前做出的移动以及一个∈{Rock,Paper,Scissors},其中之前的状态会降低选择的概率该行动再次。那么我的数据集将是这样的:scikit学习随机森林的概率分布?
PreviousAction,Chosen
Rock,Paper
Paper,Rock
Rock,Scissors
Scissors,Paper
Paper,Paper
...
是否可以学习在标签概率分布在scikit学习随机森林?