2010-03-28 132 views
4

我在我的网站上使用狮身人面像作为搜索引擎,它的工作非常完美,我没有抱怨过。它唯一缺乏的是,它不允许我搜索查询长度超过15个字的文章。我知道在现实中人们不会使用超过3-4个字我想用它来查找重复的内容。php中的文章搜索引擎

我想知道是否有任何替代解决方案的狮身人面像。我想要处理重复的内容。

我的主要文章表是innodb,但我也缓存文章到MyISAM表以及全文搜索,但是当我搜索一篇文章,它需要年龄来执行一个搜索。它不是查询问题,我认为MySQL缺乏全文搜索功能。

感谢 杰森

+0

你想要构建什么样的查询可以帮助你找到重复的内容? – Cam 2010-03-28 00:18:43

+1

仅供参考,在最新版本的sphinx中删除了“太多关键字”的限制 – user187291 2010-03-28 01:06:25

+0

@stereofrog没有它,我正在windows和centos上运行最新版本的sphinx。 – Jason 2010-03-30 16:16:24

回答

1

Apache Solr是一个另类。它基于Apache的Lucene项目...

您可能还想检查Lucene以及。

而且由于你使用MySQL,检查它的全文搜索MySQL Full Text Searching

+0

@stereofrog你是对的。我有旧的PHP API这就是为什么它不允许我使用完整的查询。谢谢 – Jason 2010-03-30 19:40:39

0

也许没有帮助,但是您可以简单地向MySQL字段添加一个唯一索引以防止插入重复项吗?

我在使用的狮身人面像版本中没有遇到任何查询长度限制(0.9.9),但也许我没有足够努力。

+0

我想找到剽窃的内容,所以添加独特的领域不是一个好的选择。我现在可以在狮身人面像插入完整的查询,但现在它不断崩溃:( – Jason 2010-03-31 12:15:21