monte-carlo-tree-search

    2热度

    1回答

    我试图在游戏上实现MCTS算法。我每次只能使用大约0.33秒。在这个时候,我可以从每个孩子的起始状态产生一到两个游戏,其中包含大约500个子节点。我的模拟不是随机的,但当然我不能根据1或2模拟做出正确的选择。在游戏中,树越来越小,我可以根据更多的模拟进行选择。 所以我的问题是在前几个步骤。有没有办法改进MCTS算法,以便它可以模拟更多的游戏,或者我应该使用其他算法?

    1热度

    2回答

    尝试使用YouTube视频和论文来学习MCST。 http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Applications_files/grand-challenge.pdf 但是我没有多少运气的理解超越了高层次的理论解释的细节。以下是上述论文中的一些引用以及我有的问题。 选择阶段:MCTS反复选择当前状态的得分最高的子节点。如果当前状态是根节点,那么这些孩

    0热度

    1回答

    任何人都可以请澄清如何(因为我没有在任何地方找到任何明确的例子)MCTS算法迭代为第二个球员。 我看起来似乎只是看起来像它正在播放,例如P1每次移动。 我理解一个代理的步骤,但我从来没有发现任何显示P2放置其计数器的代码的任何内容,这肯定在增长树时必须发生。 基本上我所期望的: 每个ITER: 选择节点PLAYER1 扩大PLAYER1 选择节点Player2 扩大玩家2 推出 backpropo