2013-12-20 59 views
0

我有一个程序,我希望通过将它分割到多台计算机上进行计算。这是我可以用Hadoop或Map/Reduce完成的事情吗?如果是这样,我该如何开始使用它?使用那么多台电脑会花费多少钱?如何使用Hadoop/Map-Reduce/etc?

回答

0

根据算法的性质,您可以拆分程序。您应该拆分输入数据,并在每个节点上将您的程序应用于该输入的一个子集。也就是说,你应该实现一个数据并行。在每个节点执行相同的程序,但在一个较小的输入。

我的建议,看看“Hadoop,权威指南”一书,前两章可以帮助你更好地理解某些东西。 如果您想尝试简单的MapReduce程序作为WordCount,您可以下载Hortonworks沙箱,您可以在虚拟机上安装该沙箱,并且您将非常快速地安装单个节点的hadoop。这里是链接http://hortonworks.com/products/hortonworks-sandbox/

+0

我问我怎么使用它。我需要访问计算机农场才能使用hadoop吗? – user115566