2013-03-04 59 views
3

我对lucene非常陌生。我有一个文本文件,其中包含100行记录,每行包含两列。第一列是用户标识,第二列是url_list(我想这些将是我的文档字段)java lucene索引和搜索每行创建一个文档的示例代码

我需要提供一个使用lucene的搜索功能,它将给包含输入的url或userid的文档。为此,我需要为每行文本文件创建一个lucene文档。

请建议我该一些示例代码..

我米使用Lucene版本3.6.2

回答

2

这里是Lucene的一个短暂而奇妙的教程初学者。

Lucene in 5 minutes


步骤

1)我认为你是预解析的文本文件,以获得用户ID的举行,相应的URL列表。你必须这样做。 Lucene不会帮助。 Lucene不会破坏属于单个字段的文本,但不会破坏文本并将用户标识添加到用户标识字段和网址字段中。

2)阅读上面的教程。我强烈建议你使用目前为4.1的Lucene的latest version

3)请注意以下事项特定于您的使用情况

  • 对每个文档两个字段:USER_ID,URL(当然你可以改变这些名字)

  • 不要ANALYZE(分解为令牌)USER_ID字段的内容。

  • 我不知道如何存储URL字段。您可能不希望对其进行分析或使用可识别URL而无需标记的StandardAnalyzer。

4)您可以在本教程中找到用于索引,查询,搜索和检索结果的示例代码。

+0

嗨,感谢您的帮助..但我没有得到任何源代码创建每行1个文件..我应该用什么?另外我有一个文本文件,如 - > useripaddress url ...我只需要为这样的行创建和索引文档。 – sm21 2013-03-07 05:30:50

+0

你的意思是解析你的文本文件?这不属于Lucene ..代码可以写成只有你可以提供你在该文件中的文本样本,并清楚地解释你希望它被索引的方式。 – phani 2013-03-07 14:00:11