我正在尝试将全文搜索功能添加到我的RoR应用程序,但在涉及到阿拉伯语时遇到一些问题。 AFAIK,那里没有很多搜索引擎支持阿拉伯词干,词法和其他高级全文搜索。我唯一发现的是带有AraMorph标记器的Lucene。RoR中的阿拉伯文全文搜索
acts_as_solr插件(solr基于lucene,这个插件将它与Rails集成)似乎被放弃了,而且我找不到任何有用的文档。
我已经看过狮身人面像,xapian,雪貂,和acts_as_searchable,但他们都没有提供高级阿拉伯文搜索功能,据我所知。
任何帮助将非常感激
==更新
我有建议使用狮身人面像,而我却用它在早期的一个项目,它工作得很好。但是,它不提供任何高级搜索功能。
例如,词语:كتاب(书),مكتبة(图书馆)和كاتب(作家)都来源于相同的词干كتب。我想有能力搜索“作家”,并获得从同一词干衍生的所有单词的结果。
另外,我想让搜索考虑到常见的阿拉伯语听写风格。有些人使用“hamza”(همزة),有些人则没有。其他人用字母“taa marboota”(التاءالمربوط)写字,而其他人用字母“haa”(الهاء)写字。一个好的阿拉伯语搜索引擎应该意识到这些微妙的差异并寻找它们。
随着狮身人面像,你只能得到你所寻找的东西,而我发现的唯一引擎,以阿拉伯文的语言来容纳这些问题,是带有AraMorph标记器的Lucene。但是,acts_as_solr(用于rails的lucene插件)被放弃。所以我的问题是:任何搜索引擎是否还有其他此类标记器?
KandadaBoggu提到的黑子,我给一个去,并进行回应
Thanx为链接。我早些时候遇到过,并且设法让狮身人面像在阿拉伯语网站上运行。请检查我的问题的更新,以更好地解释我的问题。 – Faisal 2010-03-11 10:25:33
我会接受这个答案,因为它提供阿拉伯文搜索和字符折叠。但是,干扰并没有解决。 – Faisal 2010-04-21 09:24:16