2017-05-04 47 views
0

我刚刚熟悉R的tm包。如果文件夹中有单独的.txt文件,我知道如何将这些文件转换为R中的一种语料库文件 。但是在我的具体情况中,我在一个文件中包含所有文本数据。该文件中的每个句子代表一个文档,并具有前面的 短语ID和句子ID。 .tsv文件如下所示:如何将包含文本数据的文件转换为R tm的语料库格式

PhraseId SentenceId 156061 8545间歇性令人愉悦但主要是常规性的努力。 156062 8545间歇性的令人愉悦的,但大多是日常的努力156063 8545一156064 8545间歇性令人满意,而且大多是日常的努力.....

我怎样才能变换的文本数据这样的文件到tm的语料格式?

回答

0

Try:

library(tm) 

txt<-("PhraseId SentenceId 156061 8545 An intermittently pleasing but mostly routine effort . 156062 8545 An intermittently pleasing but mostly routine effort 156063 8545 An 156064 8545 intermittently pleasing but mostly routine effort ") 

text.corpus<-Corpus(VectorSource(txt)) 
相关问题