我使用波特施特默尔干的话,这里是我遇到一个问题:Zend的Lucene的问题单词“按揭”
字“抵押贷款”是否正确朵朵到“mortgag” 字“抵押权”是(可以说是不正确的)梗,以“按揭”
大约有100个文件与单词“按揭” 有1号文件与“抵押权人”字
当我建立索引,而不把“抵押权人“在任何文件中,一切工作正常:寻找”抵押“或”抵押“或” tgag“返回全部100个文件。
当我建立一个索引,其中一个文件包含“抵押权人”时,在索引中搜索“抵押权”只会返回一个带有“抵押权人”(这是“抵押权”)的文档。但是,搜索“抵押”或“抵押”将返回全部100个文件。
我可以从这个问题得出的唯一合乎逻辑的结论是lucene首先搜索预处理词,如果找不到任何结果,它将继续搜索词干词。因此,当搜索“抵押”时,它首先找到源自“抵押权人”的“抵押”并停止搜索。这是正确的行为,还是一个错误?