monte-carlo-tree-search

2热度

1回答

我试图在游戏上实现MCTS算法。我每次只能使用大约0.33秒。在这个时候，我可以从每个孩子的起始状态产生一到两个游戏，其中包含大约500个子节点。我的模拟不是随机的，但当然我不能根据1或2模拟做出正确的选择。在游戏中，树越来越小，我可以根据更多的模拟进行选择。所以我的问题是在前几个步骤。有没有办法改进MCTS算法，以便它可以模拟更多的游戏，或者我应该使用其他算法？

1热度

2回答

蒙特卡洛搜索树如何工作？

尝试使用YouTube视频和论文来学习MCST。 http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Applications_files/grand-challenge.pdf 但是我没有多少运气的理解超越了高层次的理论解释的细节。以下是上述论文中的一些引用以及我有的问题。选择阶段：MCTS反复选择当前状态的得分最高的子节点。如果当前状态是根节点，那么这些孩

0热度

1回答

蒙地卡罗树搜索交替

任何人都可以请澄清如何（因为我没有在任何地方找到任何明确的例子）MCTS算法迭代为第二个球员。我看起来似乎只是看起来像它正在播放，例如P1每次移动。我理解一个代理的步骤，但我从来没有发现任何显示P2放置其计数器的代码的任何内容，这肯定在增长树时必须发生。基本上我所期望的：每个ITER：选择节点PLAYER1 扩大PLAYER1 选择节点Player2 扩大玩家2 推出 backpropo