2012-02-02 78 views
0

我已经经历了jama和小马(我在java中编写代码)。他们都期望我使用数组,使得行数多于coloumns的数量。在java中svd的问题

但是在潜在语义分析(LSA)的情况下,我有5本书,总共有1000个单词。当我使用术语文档矩阵时,我得到一个5 * 1000的矩阵。

由于这不起作用,我被迫转置矩阵。在转置我使用1000 * 5。用1000 * 5当我执行svd时,我得到一个5 * 5的S矩阵。为了执行降维,5 * 5矩阵看起来很小。

可以做些什么?

回答

0

您使用的文本片段大小太大。文档(列)应该代表一页或几页文本,也许是最大的一章。我也看过使用段落大小。