使用人工智能预防垃圾邮件

是否有使用人工智能方法（如自然语言处理，社交智能等）防止垃圾邮件，不良语言等在人类输入中的研究/解决方案？使用人工智能预防垃圾邮件

2011-01-28 Jeff

你的意思是http://en.wikipedia.org/wiki/Bayesian_spam_filtering？ – 2011-01-28 13:20:12

有很多这样的解决方案，我会介绍几个最广泛使用它们。

Bayesian spam filtering是基于Bayesian probability一个经典的方法。这是一种古老的技术，所以如果你想使用它，可以考虑采用不同的启发式方法来改善结果（详见维基百科的文章）。
语义方法像LSA。对于我来说，名为Random Indexing的LSA修改版给出了最好的结果，对于所有电子邮件的30％的训练样本，得分为〜99.3％。还有一种称为PLSA的技术，它结合了LSA和概率论。
Support Vector Machine。与以前的方法相比，这些方法对于任何数量的类都是通用的，这种技术更适合分类到2个类，例如，垃圾邮件和而非垃圾邮件。我从来没有尝试过，但许多论文都描述了用SVM进行分类的高效结果。