2017-04-21 138 views

回答

1

CorenNLP具有不区分大小写的模型,只能用于英语。他们称他们为caseless models。阅读警告那里,如果你使用版本3.6.0

一对情侣在链接中提到几点:

  1. 您可以修复的文本中的字母大小写和使用的正常模式。你可以使用TrueCaseAnnotator
  2. 一起训练CoreNLP自己不区分大小写的模型,你可以指定一个令牌预处理程序,忽略大小写

    wordFunction = edu.stanford.nlp.process.LowercaseFunction