2011-05-02 60 views
0

我试图用主题,正文和所有附件索引完整的电子邮件消息。对于索引,我使用常见的SolrInputDocument。如何将附件添加到要编入索引的文档中?我在这里找到了类似的帖子SolrJ keeps indexed files open,但它只显示了如何从文档数据中分别索引文件的方式。如何将文件索引作为其他电子邮件数据(如主题,正文,发件人等)的一部分?SOLRJ和索引文件

回答

0

您是否还希望文本中的文本可被搜索?如果是的话,那么在Tika采取掠夺,帮助阅读RTF,PDF等格式的文件。

如果不是,您可以将附件的路径和文件名存储在索引和附件中的某个路径上。

+1

是的,我需要索引文件内容。我知道蒂卡,但试图了解API。只有索引文件的方式(在我看来)是使用ContentStreamUpdateRequest分别对它们编制索引csur = new ContentStreamUpdateRequest(“/ update/extract”); csur.addFile(doc);但在我的情况下,附件是电子邮件消息的一部分,所以我需要将它们作为消息数据的一部分进行索引。 – 2011-05-03 07:19:08