2012-04-08 82 views
0

我正在做一个使用向量空间模型的搜索引擎项目,为此我需要创建一个术语文档矩阵,然后在其上应用SVD。在java中为LSI实现创建术语文档矩阵

我应该把这个词作为行和文档作为列吗?

我做它在Java所以它应该是这样的:

计数[keywordList.size()] [listOfFilesinCorpus.length]

还是应该是相反的?我需要将这个二维数组传递给apache commons数学的:

RealMatrix A = Array2DRowRealMatrix(TDM);

其中TDM是术语文档矩阵。

我需要条件作为尺寸,然后我会比较向量空间中的文档。请帮助,谢谢。

回答

2

它并不重要,你可以随时在两个换位之间切换!

但通常,行是条款和列是文件

+0

哈哈这是一个答复后近一年:D。真棒我会接受它无论如何 – 2013-01-29 14:48:24

+0

非常感谢;) – bendaizer 2013-01-29 15:22:38