2013-02-18 60 views
0

我想在R中使用Wordnet的getLemma函数推理语料库,但我不确定如何使用它。如何使用Wordnet在R中进行词式化?

下面是使用R中共发现包词形还原给定的文档..

filter <- getTermFilter("StartsWithFilter", "car", TRUE) 
terms <- getIndexTerms("NOUN", 5, filter) 
sapply(terms, getLemma) 

我的问题是我有一个包含5000个字的文件,在这种情况下,我想每一个字转换成其基地/根词。例如:发烧 - >发烧;发烧 - >发烧

我想lemmatize语料库中所有的话,不会将其限制为词StartingWith ......,我也不明白在terms <- getIndexTerms("NOUN", 5, filter)

数字5的意义这将是很好,如果有人能为我解决这个问题。

感谢

+2

欢迎SO。如果你想获得答案,你应该提供一个可重复的例子,并描述你已经尝试做什么... – juba 2013-02-18 17:58:00

+0

filter < - getTermFilter(“StartsWithFilter”,“car”,TRUE)terms < - getIndexTerms(“NOUN”, 5,过滤器)sapply(terms,getLemma)我想要将语料库中的所有单词词汇化并且不会将其限制为词StartingWith ...,我也不理解数字5在“terms < - getIndexTerms(” NOUN“,5,过滤器)” – user1946217 2013-02-19 05:35:33

回答