2016-09-19 211 views
0

我已经使用了Standford NLP来识别给定句子的POS。NLP从句子提取字典单词

我需要从句子中只提取正确的单词(词典中定义的单词)。

对于例如:如果一句话就是“我去纽约的航班6AWDR

当我使用斯坦福NLP,都写着“飞行”和“6AWDR”被标记为PartOfSpeechAnnotation.class的“NNP”。

如何在一个句子中单独提取适当的英语单词?

回答

0

我已经使用Apache Utils来识别字符串是否为Alpha。

假设是大多数字母数字单词在字典中将不是有效单词(除非它们是缩写)