我对lucene非常陌生。我有一个文本文件,其中包含100行记录,每行包含两列。第一列是用户标识,第二列是url_list(我想这些将是我的文档字段)java lucene索引和搜索每行创建一个文档的示例代码
我需要提供一个使用lucene的搜索功能,它将给包含输入的url或userid的文档。为此,我需要为每行文本文件创建一个lucene文档。
请建议我该一些示例代码..
我米使用Lucene版本3.6.2
我对lucene非常陌生。我有一个文本文件,其中包含100行记录,每行包含两列。第一列是用户标识,第二列是url_list(我想这些将是我的文档字段)java lucene索引和搜索每行创建一个文档的示例代码
我需要提供一个使用lucene的搜索功能,它将给包含输入的url或userid的文档。为此,我需要为每行文本文件创建一个lucene文档。
请建议我该一些示例代码..
我米使用Lucene版本3.6.2
这里是Lucene的一个短暂而奇妙的教程初学者。
步骤
1)我认为你是预解析的文本文件,以获得用户ID的举行,相应的URL列表。你必须这样做。 Lucene不会帮助。 Lucene不会破坏属于单个字段的文本,但不会破坏文本并将用户标识添加到用户标识字段和网址字段中。
2)阅读上面的教程。我强烈建议你使用目前为4.1的Lucene的latest version。
3)请注意以下事项特定于您的使用情况
对每个文档两个字段:USER_ID,URL(当然你可以改变这些名字)
不要ANALYZE(分解为令牌)USER_ID字段的内容。
我不知道如何存储URL字段。您可能不希望对其进行分析或使用可识别URL而无需标记的StandardAnalyzer。
4)您可以在本教程中找到用于索引,查询,搜索和检索结果的示例代码。
嗨,感谢您的帮助..但我没有得到任何源代码创建每行1个文件..我应该用什么?另外我有一个文本文件,如 - > useripaddress url ...我只需要为这样的行创建和索引文档。 – sm21 2013-03-07 05:30:50
你的意思是解析你的文本文件?这不属于Lucene ..代码可以写成只有你可以提供你在该文件中的文本样本,并清楚地解释你希望它被索引的方式。 – phani 2013-03-07 14:00:11