2015-11-05 36 views
0

我有矢量对象的话,基本上是这样一个列表:R:数据框与列表的occurances对象

print(myDocuments) 
[[1]] 
[1] 4234 3134 1224 

[[2]] 
[1] 1234 1312 4123 

[[3]] 
[1] 1266 4234 

[[4]] 
[1] 1266 4234 4123 1234 

所以myDocuments持有向量的每个文件(4个文件总数),每个向量包含一组哈希码(在本例中由4位int简化)。

我现在需要的是一个data.framematrix,与被列在文件和行是文件的散列码。该数据帧应显示1如果特定的文档中存在的散,和0,如果没有,像这样:

N  D1 D2 D3 D4 
1224 1 1 0 1 
1234 0 1 0 1 
1266 0 0 1 1 
3134 1 0 0 0 
4234 1 0 1 1 
4123 0 1 0 1 

我真的很难让这个R中完成的,任何帮助表示赞赏!

在此先感谢!

回答

0

我们可以尝试

library(qdapTools) 
t(mtabulate(myDocuments)) 
#  [,1] [,2] [,3] [,4] 
#1224 1 0 0 0 
#1234 0 1 0 1 
#1266 0 0 1 1 
#1312 0 1 0 0 
#3134 1 0 0 0 
#4123 0 1 0 1 
#4234 1 0 1 1 
+1

完美,非常感谢为! – CoffeeeeCup