其实我正在为邮轮公司做评论分析。我不能告诉你整个程序,因为它很长,但至少是一个快照。我把所有的评论,分成几个句子,然后从评论中提取一些短语......例如, '美妙的小屋','优质的服务'。现在为了情感分析,我必须将该短语的所有名词映射到特定的主题。现在在那个映射中,我需要所有名词的同义词和所有关于这个词的词语。所以我的文本挖掘的最终结果将会更加高效。我想你对我正在做的事情有一点点想法。 我会重复我的问题..在Excel中我有一行单词或说名词..当我运行代码[R,VBA或任何]它应该给我与这些单词有关的所有单词.. [我提取同义词与vba代码]。 希望你明白了..?创建词的其他形式[名词,形容词,复数,动词..一切]
-2
A
回答
4
您可以使用包tm
及其词干功能。
如果你的文本文件是
text <- c("taste", "tastes", "tasting")
您可以创建一个文集
corpus <- Corpus(VectorSource(text)
然后有脑干功能剥离的话他们的根。 (助手功能避免了一些问题。)
stemDocumentfix <- function(x){ # put in business code
PlainTextDocument(paste(stemDocument(unlist(strsplit(as.character(x), " "))), collapse=' '))
}
corpus <- tm_map(corpus, stemDocumentfix)
inspect(corpus)
<<VCorpus (documents: 3, metadata (corpus/indexed): 0/0)>>
[[1]]
<<PlainTextDocument (metadata: 7)>>
tast
[[2]]
<<PlainTextDocument (metadata: 7)>>
tast
[[3]]
<<PlainTextDocument (metadata: 7)>>
tast
您也可以看看qdap
包,它提供了一系列的功能,用于文本挖掘。
相关问题
- 1. 单词的名词,动词,形容词等的单独列表
- 2. 将形容词和副词转换为名词形式
- 3. 名词,动词,形容词等的单词列表
- 4. 将单词识别为名词,动词或形容词
- 5. SQL名词复数形式的函数
- 6. Perl模块查找单词是否是动词/名词/形容词/文章/介词
- 7. 如何返回词的副词形式
- 8. 应该如何创建Rails控制器?它应该是动词,名词还是形容词?
- 9. 如何命名为形容词或介词的Rails资源?
- 10. 从WordNet获取名词和形容词列表
- 11. 为“High Score”建议的动词/名词
- 12. 词形化java
- 13. 从名词词组获得动词python
- 14. 单词列表的词形化
- 15. 接口命名为形容词
- 16. 用一个句子替换代词,名词,动词和形容词及其相应的标签,我怎样才能在Python中有效地做到这一点?
- 17. 在actionscript-return中的高级文本搜索所有名词,形容词和动词
- 18. 使用词网找到没有名词同义词或至少有一个名词同义词的词条
- 19. 检测代词及其名词?
- 20. 寻找同义词和倾斜词的基本形式
- 21. 有没有将形容词连接到它们相应名词的算法?
- 22. Python - 生成单数名词的复数名词
- 23. 将单词替换为除Python中的名词和形容词之外的特殊字符串
- 24. 当一个单词的同义词与它的复数形式相同时:如何命名列表和实例?
- 25. 计算形容词频率的技巧
- 26. 通过斯坦福解析器提取所有名词,形容词形式和文本
- 27. 在RESTful URL中使用动词和形容词的替代方案
- 28. POS tagging - NLTK认为名词动词
- 29. J,不易动词动词
- 30. Python正则表达式查找单词与其他词分开
嗯这样的字典用例是什么?也许把词汇转换成一个共同的根源是另一种选择。如果没有,你应该看看像[WordNet]这样的数据库(http://en.wikipedia.org/wiki/WordNet)。无论如何,这个问题可能太广泛了。 – lukeA 2015-02-11 11:20:59
我不知道R绑定,但看到https://www.nodebox.net/code/index.php/Linguistics - verb.infinitive()/ present_participle() - 他们采取的方法记录 – 2015-02-11 11:27:16
@Roland:可以一个OP接受对暂缓问题的回答? – lawyeR 2015-02-11 13:28:44