回答

2

所有这些方法对于多元数据都更好。除了历史上用于一维数据的k-means以外,它们全都是,设计时考虑了多变量问题,并且它们都没有针对1维数据的特定情况进行优化。

对于一维数据,使用核密度估计。 KDE在1d中是一项很好的技术,拥有强大的统计支持,并且很难用于多维集群。

0

看看K-means clustering algorithm。该算法非常适合聚类一维特征向量。但是,如果训练数据集中存在异常值,那么K表示聚类算法效果不佳,在这种情况下,您可以使用一些先进的机器学习算法。

我建议在为您的数据集和问题陈述实施机器学习算法(分类,聚类等)之前,您可以使用Weka Toolkit来检查哪种算法最适合您的问题陈述。 Weka工具包是大量机器学习和数据挖掘算法的集合,可以针对特定问题轻松实现。一旦确定哪种算法最适合您的问题,您可以修改或编写自己的算法实现。通过调整它,你甚至可以达到更高的准确性。您可以从这里获得download weka。