我在亚马逊网络服务上有一台机器,我正在尝试一些搜索功能。我在我的AWS机器上安装了Nutch和Hbase。在亚马逊网络服务和本地集成Solr + Hadoop和Nutch + Hbase
我以爬虫wikipedia.org为例,抓取的数据存储在Hbase的云中。
我想安装Solr并对其进行搜索。我没有安装我的系统作为一个集群,因为我只是想做一些研究,即如何使用它等。
我的问题是Hadoop站在这个系统(我没有安装Hadoop呢)?安装Hadoop和Solr我的本地计算机是合乎逻辑的。另外我的下一个挑战将是如何与AWS电脑沟通我的本地计算机。
查看CloudSearch(aws.amazon.com/cloudsearch/)以便能够按比例进行搜索(比管理群集简单得多) – Guy 2013-03-09 18:51:49
@Guy我的目的是为了获取有关此类事物的知识。 – kamaci 2013-03-10 13:10:15
当您问到有关Hadoop和CloudSearch是否特别基于Hadoop时,我没有详细介绍。它的尺寸很好,但取决于您的要求。 – Guy 2013-03-11 12:47:13