2017-09-05 58 views
1

我想训练一个模型中使用opennlp分类鸣叫。我的问题是我应该在用于训练模型的tweets上执行标记化,停止单词删除等操作,还是应该直接使用tweet而不执行消毒处理?NLP分类培养模式

+0

什么你的模型正试图完成? – TrnKh

回答

0

这真的取决于你是什么样的培训:

  • 如果你的算法旨在收到简单的文本,并将其使用在其上的机器学习技术之前执行自身所有的简化你应该提供对的键入
  • 否则,如果你只是trianing一个黑盒子,我会说,如果你的模型是要在特定类型的功能的工作,你的情况记号化和朵朵字应该对这种类型的数据进行培训,以提供