0
我正在做一个使用向量空间模型的搜索引擎项目,为此我需要创建一个术语文档矩阵,然后在其上应用SVD。在java中为LSI实现创建术语文档矩阵
我应该把这个词作为行和文档作为列吗?
我做它在Java所以它应该是这样的:
计数[keywordList.size()] [listOfFilesinCorpus.length]
还是应该是相反的?我需要将这个二维数组传递给apache commons数学的:
RealMatrix A = Array2DRowRealMatrix(TDM);
其中TDM是术语文档矩阵。
我需要条件作为尺寸,然后我会比较向量空间中的文档。请帮助,谢谢。
哈哈这是一个答复后近一年:D。真棒我会接受它无论如何 – 2013-01-29 14:48:24
非常感谢;) – bendaizer 2013-01-29 15:22:38