2010-11-22 119 views
4

请建议一个好的机器学习分类器,用于数据集的真实分类。 另外,是否有可能在这样的分类器中指定自己的规则/特征来进行归类?感谢您的所有建议。自然语言处理 - Truecaser分类器

谢谢

回答

3

我在Python中实现了一个版本的truecaser。当你提供足够的数据(即正确的句子)时,它可以训练任何语言。

对于英语,它对维基百科的样本句子的准确率达到98.38%。提供了预先训练的英语模型。

你可以在这里找到: https://github.com/nreimers/truecaser

+0

鼓励与外部资源的链接,但请在链接上添加上下文,以便您的同行用户了解它是什么以及它为什么在那里。如果目标网站无法访问或永久离线,请始终引用重要链接中最相关的部分。从[如何回答](http://stackoverflow.com/help/how-to-answer)。 – 2016-06-09 14:15:45