2012-04-04 54 views
0

我用nutch爬过很多网站。我使用Solr 3.4来浏览结果,但我想按其域名对结果进行分组。例如,如果我搜索“tabnak”,第一个结果只包含“http://tabnak.ir”,并不显示该域的其他结果(如谷歌)。如何在solr中按域分组结果?

我想忽略结果,如:

http://tabnak.ir/en/news/1020/title 
http://tabnak.ir/fa/allnews 
... 

如何创建与组,group.field和Solr查询......?

感谢

+0

你是什么意思? – hadi 2012-04-04 20:45:11

+0

据我所知,SOLR不知道域名。这只是一个字符串。此外,我认为这个问题还没有很好解释,请再磨光一下 – 2012-04-09 23:36:20

回答

0

你应该创建一个单独的索引字段(例如命名在这种情况下,“域”),并应确保你从一个网址的域时SOLR索引数据。

然后,您必须将字段合并分组应用到搜索结果中。参见:http://wiki.apache.org/solr/FieldCollapsing