我正在寻找一个信誉良好的Java,开源(最好)库/包,它将文本作为输入并识别并标记其中的词性。 组件,如: Verbs + Tense + Passive/Active {Simple Present, Past Progressive, Past Passive, Present Perfect ... }
Prepositions of movement {from, to...}
Pre
短版: 如果我有一朵朵字: Say 'comput' for 'computing', or 'sugari' for 'sugary' 有没有一种方法来构建它最接近的名词形式? That is 'computer', or 'sugar' respectively 加长版: 我使用Python和NLTK,共发现上一堆话执行一些语义相似的任务。 我注意到大多数sem-sim分数只适用于名词,而形容
我对nlp相当陌生,我试图弄清pos标签。 我目前正试图走出斯坦福NLP POS恶搞,网址:http://nlp.stanford.edu/software/tagger.shtml 从上面的链接,有这样一句话: 打标签可以在任何语言来重新培训,给POS标注 培训该语言的文本。 但是,我无法让它工作。我现在所能做的就是给它一个文本文件来标记。例如, String test = "this is a
Penn Treebank tagset对于单词“to”具有单独的标记TO,而不管它是否用于介词意义(如I went to school)或不定式意义(如I want to eat)。从NLP的整体角度来看,这有什么用途?只是将无限期标记为'分开'具有直观意义,但我没有看到将不定式和介词组合在单个标签中的逻辑。 谢谢,并道歉,如果这不符合堆栈溢出指导方针。