我们面对不同的搜索引擎为我们的研究 档案并具有浏览Xapian的欧米茄文档,我们 决定自欧米茄选项似乎是一个 尝试一下适当的解决方案和几个有趣的搜索选搜索 - 使用通配符或正则表达式
我们在Linux服务器上安装了Xapian-Omega(Deb 7)并测试了成功的设置 。然而,我们不确定 如何使用Xapian-Omega,或者甚至可以使用Wild Cards或常规 表达式。
我们读到Xapian必须启用Wild Card选项 “QueryParser flags” 有人可以澄清一下吗? 即。用一个或两个示例解释或指示一个页面。
但我们并没有看到关于与欧米茄 CGI虽然后者运行良好的例子多的信息,外卡选项(如*为广大外卡?为单个字符), 似乎并不 就到按预期工作,默认情况下它们是 有用,即使干扰和子字符串等可能是有用的。
如:这将是有趣的,能够使用标准的简单 野生字符的搜索具有一定的精确度,例如: 医药医疗药物 或军医*?对于单个字符
Regexp可以用欧米茄识别吗? 例如:sep [ae] r [ae] te(\ w +)? (dev邮件列表)关于 这一建议 或搜索结构化的格式,如电子邮件或信用卡 号或研究论文等
在从奥利贝茨记不久前一定的公式类型是到grep指数但这会让 击败欧米茄的RAD优势。
使用欧米茄通配符或正 表达式搜索的任何示例将是非常赞赏...甚至 ,其中有关这个主题的信息很好地举例说明了如何使用来开发先进的搜索 呈现 页面指示Xapian本身是最受欢迎的(也许是PHP或Python)。
(我们不关心有关索引大小的尺寸或 时间指数最终 大幅增加存档的那一刻)