2011-02-03 182 views
5

我想为使用Django编写的网站实施搜索解决方案。从可用的选项(我研究过Solr,Sphinx,Xapian,PostgreSQL/Tsearch3,MySQL)Sphinx看起来最好。但是,它不支持为波兰语进行遏制,而这是我想要搜索的数据的语言。波兰搜索狮身人面像?

在Sphinx中处理不支持的语言的最佳方式是什么?我有一个直觉,我可以从Ispell字典中创建一个词干语料库。我如何能够与狮身人面像一起工作?

回答

0

搜索http://snowball.tartarus.org/邮递员,你可能会发现一些信息,如果有人试图创建一个波兰词干。有2个免费的stemmers可用,但它们是用java制作的(我认为至少有一个是为solr/lucene制作的)。从Ispell,我不确定这个词干语料库是否可以帮助您,您可以创建文件以用于字形或其他语言。