2010-06-29 131 views
4

我正在使用Lucene搜索。在Lucene中使用变音符号进行索引和搜索法语文本

我上传了一个法文文件(french.txt),内容如下。

multimédia francophone pour l'enseignement du français langue étrangère 

如果我搜索francophone话,就说明在搜索结果中的文件。但是,当我搜索multimédiafrançaisétrangère时,它不显示任何结果。

我试过使用org.apache.lucene.analysis.fr.FrenchAnalyzer,但它仍然无法正常工作。

我们如何搜索如上所述的法语单词?

+3

我假设你已经阅读[this](http://wiki.apache.org/lucene-java/IndexingOtherLanguages) – Yacoby 2010-06-29 11:21:49

回答

0

您是否在分析器中使用ISOLatin1AccentFilterFactory作为索引文本的字段?确保如果你有它的索引分析器,你也有它的查询分析器。

0

顺便说一句。如果您正在使用ISOLatin1AccentFilter注意,获得了有利于ASCIIFoldingFilter

+0

谢谢,我没有注意到! – 2010-06-29 15:20:46

0

。基本上过时了,你有两个选择:

  1. 指数和搜索与雪球分析仪法国文件法国
  2. 指数的法语文档作为通常,但使用FuzzyQuery进行搜索(不是很准确,但在您的特定情况下可能已足够)。