在使用PCA之后,我在2D中可视化了一个数据集。 1维是时间,Y维是第一个PCA组件。如图所示,点(A,B)之间有相对较好的分离。但不幸的是,聚类方法(DBSCAN,SMO,KMEANS,Hierarchical)无法将这些点集中在两个群集中。正如您在A部分看到的那样,存在相对连续性,并且这个连续过程结束并且B部分开始,并且与A和B之间的过去数据相比存在相当大的缺口。聚类视觉可分簇的算法
如果您能介绍,我将非常感激我可以使用任何方法和算法(或者考虑数据的分布从数据中设计任何度量),以便能够在没有可视化的情况下在A和B之间进行分离。非常感谢。
这是为上述区2个PCA分量(第一个)的曲线图。另一个也是其他数据集的组件的情节,我也得到了不好的结果。
谢谢。我想使用PCA。你能解释更多吗?因为我在PCA组件上使用了集群,但没有得到期望的结果。 – Arkan
您是否正在学习第一个数据集上的PCA投影(这会给您带来好的结果),然后在第二个更难的数据集上应用投影(无需学习!)?如果这对你没有帮助,那么你的确应该看看光谱聚类,或者像Anony-Mousse所说的时间序列,因为显然你应该学习时间上的重复图案(A),它有时可能会破裂(B,异常) 。 – gaborous
谢谢。请考虑第二和第三个情节。 x和y轴是PCA组件(PC 1和PC2)。你知道任何测试光谱的好工具吗?我找到了一些Matlab代码,但它们没有很好的结果,并且像这些2个数据集(2和3)上的其他聚类方法一样。 – Arkan