0
如果我施加PCA上的特征向量,然后我做聚类,例如像以下:PCA前K均值聚类
reduced_data = PCA(n_components=2).fit_transform(data)
kmeans = KMeans(init='k-means++', n_clusters=n_digits, n_init=10)
kmeans.fit(reduced_data)
减小的数据将是在PCA分量而言,使后 在kmean中聚类,可以得到每个点的标签 (reduced_data),如何知道源数据中哪一个?
如何玩关于 集群数量的PCA组件数量?谢谢。