2016-06-09 76 views
0

这是在Amazon Cloudsearch上的,但它可能适用于任何通用的Lucene/Solr安装。按字段划分的搜索结果 - cloudsearch/solr/lucene

我正在索引一大堆文章和对那些被搜索文章的评论。当我搜索“特朗普很烂”时,我希望能够找回匹配的评论列表,列出的评论匹配的文章。

我知道我可以索引他们在2个独立的领域,但我不知道是否有对现场做了一个“独特”的更简单的方法......换句话说......

我有一个列表对于其中还包含的article_id作为字段每个评论..所以索引文件:

ID = 1 { '的article_id':10}

ID = 2 { '的article_id':10}

现在如果这两个评论匹配,我会得到2个结果。 (是的,我可以在客户端做一个独特的,但它会搞砸分页等)。我希望能够返回[10]

回答

0

在CloudSearch中无法实现独特功能,因此您需要提出另一种解决方案。

我可以提供的最好的方法是将所有注释连接到文章记录上的单个文本字段,并添加一个类型字段以区分评论和文章(如果您还没有)。然后,您可以查询type = Article,同时搜索连接的评论和文章正文,并且只会收到每篇文章的一个结果。

即使将数千条评论连接到每篇文章中的单个字段,我相信CloudSearch的表现也会很好(甚至可能比成千上万的额外记录要更好),但是更新过程以连接所有评论可能会得到重。如果您获得数千条评论,而不是添加标志跟踪(如果已将其连接起来,那么您不必重新构建它们,每次都会有所帮助)。