2010-10-21 53 views
0

嘿家伙, 我想允许人们输入简单的文本搜索条件,运行猪工作(如果这是最好的,这是我最了解的)并输出结果(tsv文件结果?)所以我可以在Web界面中显示它们。特设报告Hadoop

有什么解决这个问题的? 任何已知的事情都会将我想要的流程的几个不连贯的部分连接在一起?

谢谢,

回答

3

为什么不将索引文件编入Lucene或Solr?然后您可以实时进行文本搜索。 Hadoop是专为面向批处理的流程而设计的,在这种情况下,它看起来并不像你想要的那样。

+0

从未做过solr索引。我猜想概念证明是我要做的第一个传球,实施Solr/Lucene索引可能比我打算做的更多。 – ButtersB 2010-10-21 18:05:25

+0

真的吗?将Solr用于POC可能比将Hadoop用于未设计的东西更容易。 – bajafresh4life 2010-10-22 00:04:57

1

那么,这取决于你的项目的要求。它是否需要低延迟,以及特别搜索有多复杂。那么我认为hbase +猪可能是一个解决方案。 hbase可以用于搜索实时搜索目的(虽然其搜索功能不如RDBMS强大),并且可以用于批量处理大量数据。