2010-03-11 39 views
0

我正在尝试将全文搜索功能添加到我的RoR应用程序,但在涉及到阿拉伯语时遇到一些问题。 AFAIK,那里没有很多搜索引擎支持阿拉伯词干,词法和其他高级全文搜索。我唯一发现的是带有AraMorph标记器的Lucene。RoR中的阿拉伯文全文搜索

acts_as_solr插件(solr基于lucene,这个插件将它与Rails集成)似乎被放弃了,而且我找不到任何有用的文档。

我已经看过狮身人面像,xapian,雪貂,和acts_as_searchable,但他们都没有提供高级阿拉伯文搜索功能,据我所知。

任何帮助将非常感激

==更新
我有建议使用狮身人面像,而我却用它在早期的一个项目,它工作得很好。但是,它不提供任何高级搜索功能。
例如,词语:كتاب(书),مكتبة(图书馆)和كاتب(作家)都来源于相同的词干كتب。我想有能力搜索“作家”,并获得从同一词干衍生的所有单词的结果。
另外,我想让搜索考虑到常见的阿拉伯语听写风格。有些人使用“hamza”(همزة),有些人则没有。其他人用字母“taa marboota”(التاءالمربوط)写字,而其他人用字母“haa”(الهاء)写字。一个好的阿拉伯语搜索引擎应该意识到这些微妙的差异并寻找它们。

随着狮身人面像,你只能得到你所寻找的东西,而我发现的唯一引擎,以阿拉伯文的语言来容纳这些问题,是带有AraMorph标记器的Lucene。但是,acts_as_solr(用于rails的lucene插件)被放弃。所以我的问题是:任何搜索引擎是否还有其他此类标记器?
KandadaBoggu提到的黑子,我给一个去,并进行回应

回答

1

你应该通过扩展思维狮身人面像选择

阅读本试试这个:http://www.expressionlab.com/2008/11/19/thinking-sphinx-in-arabic-unicode

+0

Thanx为链接。我早些时候遇到过,并且设法让狮身人面像在阿拉伯语网站上运行。请检查我的问题的更新,以更好地解释我的问题。 – Faisal 2010-03-11 10:25:33

+0

我会接受这个答案,因为它提供阿拉伯文搜索和字符折叠。但是,干扰并没有解决。 – Faisal 2010-04-21 09:24:16

1

对于Solr的使用SunspotSunspot Rails

对于狮身人面像使用Thinking Sphinx

两种宝石是优秀的,有一个大的安装基础。我在很少的项目中使用了ThinkingSphinx,我高度推荐它。

+0

我用狮身人面像+ ThinkingSphinx用阿拉伯语。工作正常。 – uzzz 2010-03-11 09:13:02

+0

狮身人面像是伟大的,用它在一个项目之前在阿拉伯文和它的作品。但是,它不提供任何高级的完整搜索功能。它只搜索我给它的任何东西,没有词干,形态或考虑到阿拉伯语变音符号。 我会给太阳黑子去,并报告返回 – Faisal 2010-03-11 09:58:28

+0

太阳黑子轨道似乎是一个非常坚实的搜索引擎。但是,我确实设法使它与AraMorph(阿拉伯语词干分析师)合作。 Thanx为反馈提示 – Faisal 2010-03-24 09:38:50