2017-03-07 79 views
0

算法,击败*纽约时报'人工智能没有蛮力强迫在岩石/纸/剪刀? (在老兵模式)算法,击败这纽约时报“岩石/纸/剪刀AI

http://www.nytimes.com/interactive/science/rock-paper-scissors.html?_r=1& (必须启用Flash与AI玩)(网站不断地给出了AI如何选择下一步的行动,你参加了至少5次后的信息)

我学习机我自己学习,我很新手。 (刚刚开始昨天)。

我的朋友告诉我,他们被分配到解决上述问题,而不需要学习ML课程中的任何ML技术。我也想这样做,但除了暴力强迫之外,我想不出其他任何方式。

对于训练数据集玩AI100或更多时间并收集这些100或更多的数据。使用此数据创建算法,以便在使用程序时赢得更多游戏而不使用程序。作为一名超级新手,我根本想不出什么。

任何提示? 感谢

回答

0

新手模式

因此该网站的好处是,是,它给出了这个概念背后的一举一动。它试图通过查看你的动作历史来预测你的动作。 所以,你的移动历史可能是以下几点: (石= R,剪刀= S和纸= P)

r p s p p s s r r p s 

现在看起来透过历史,并试图找到r p s复发。它在历史开始时发现r p s p p s s r r p s,并且发现你之后玩过p。因此计算机的下一步将是s

如果找不到字符串的重复发生(r p s),它会查看较小的字符串(p s)等等。如果它发现多次复发,挑选最多复发的那个(或者甚至只是随机选择一个)。

所以你可以编写一个程序,它和网站上的完全一样。你试图预测你自己的举动(如网站的程序)。因此例如(r p s),计算机会预测移动p,因此有了这些知识,您可以选择s

老将模式

在老兵模式AI使用20万个游戏的历史来预测你的下一步行动。因此,要尝试打败你,将以与AI完全相同的方式使用100场比赛的历史。

您可以查看当前尝试的历史记录(100场比赛),并尝试查找某种类型的重复(例如r s p r)。你看看电脑的反应是什么。现在你选择相应的东西,以便打败电脑。当然这不会总是赢,因为计算机经常在两次选择之间使用随机化的响应(以及更长的历史,所以更多的样本可供选择)。但是这应该会增加你获得的胜利。

我也没有任何机器学习的经验,但这是我编写程序的策略。

我希望这会有所帮助。

如果你不能打败他们加入他们的行列;) 干杯

+0

谢谢回答所以,你告诉我操纵AI,但有一个问题。由于AI已经在内存中保存了200,000多个节目,AI不会从我身上学到很多东西,甚至会被我操纵。你说的东西会有用如果我玩的是一个新手AI,它从我身上学到了一切,但在这种情况下,我们正在玩一个已经保存了200,000场戏的老牌AI。 – Rikenm

+0

比你用100个游戏作为历史来预测结果。 AI也会这样做。再次使用Ai在网站上使用的想法。 –

+0

我已经更新了我的答案@Rikenm –