2010-10-11 78 views
2

有没有办法检查mysql中的多个短语?MySQL查询检查某些短语(重复的文章,抄袭)

我需要检查一篇文章是否有存储在mysql中的重复版本。

这是算法 我首先创建句子的排列是检查(删除所有非字母数字字符) 然后生成查询(如何?) 后,我得到的结果我比较,如果50需要%的句子是重复的,比我认为文章是重复的。 表中的文章以删除的非字母数字字符存储。 例如:

iamdevelopingatooltocheckduplicatearticlesstoredinmysqldatabasehoweveriveencountered 

有什么建议吗?

回答

1

是的,看看“编程集体智慧”了解这些算法。他们与分组有关。