我有如下形式的函数输出(来自koRpus):887 的类型总数::393R回路-csv
考词汇多样性 MTLD测度 令牌总数: 142.66 几个因素:6.22 因子大小:0.72 SD令牌/因子:41.55(所有因素) 38(唯一完整的因素)
我想打一个循环用于存储这些结果对80个不同的文件。我曾尝试以下:
for (i in 1:length(infra$tableid)) {
whypar <- paste(infra$whypar [infra[,1] ==i], collapse=" ")
wpi<- removeWords(whypar, stopwords("english"))
as.data.frame(wpi)
write.csv(data.frame(wpi), file= "wp.csv")
tagged.text <- tokenize("wp.csv", lang="en")
res.mtld <- MTLD(tagged.text)
write.csv(data.frame(res.mtld),file="output.csv")
}
其中红外线是:
tableid 1, 2, 3, ... 80
whypar "I took part because xxx", "I believe that jshfdjk", "jhsadkjhd" ... (N=350)
感谢所有帮助
为什么这不适合你?你期望的结果是什么,你现在看到了什么?此外,如果您可以使用'dput'为'whypar'提供至少一个最小数据集,则我们可以更容易地提供帮助。 – Justin 2013-02-19 17:10:18
'dput(infra)'或'head(infra)'可能会帮助我们查看您的数据结构 – 2013-02-19 17:11:53
您不能简单地将'data.frame'作为由MTLD创建的S4对象。我不熟悉文本挖掘,但也许你想要这个对象的一个插槽。衡量文本词汇多样性的哪一部分是你对每个文件感兴趣的。使用'str(res.mtld)'来检查你的对象并找到你感兴趣的位。 – 2013-02-19 17:32:21