无监督降维算法将一个矩阵NxC1作为输入,其中N是输入向量的数量,C1是每个向量的分量数量(向量的维数)。结果,它返回一个新的矩阵NxC2(C2 < C1),其中每个矢量的分量数量较少。使用无监督降维的模糊聚类
模糊聚类算法将一个矩阵N * C1作为输入,其中N又是输入向量的数量,C1是每个向量的分量数量。结果,它返回一个新的矩阵NxC2(通常低于C1的C2),其中每个向量的每个分量都表示向量属于相应聚类的程度。
我注意到两类算法的输入和输出在结构上是相同的,只有结果的解释发生了变化。而且,在没有模糊聚类实现scikit学习,所以以下问题:
是否有意义使用降维算法进行模糊聚类? 例如,将FeatureAgglomeration或TruncatedSVD应用于根据从文本数据中提取的TF-IDF矢量构建的数据集并将结果解释为模糊聚类是否无效?