2017-06-16 76 views
1

在spark.mllib库中,KMeans具有在构建Kmeans实例时设置epsilon参数的函数。如何在新的Spark ml库中的K-Means中设置epsilon

但是我没有在Kmeans新的Spark.ml库中看到任何函数来设置这个参数。我所问的原因是因为新KMeans生成的簇的数量少于我在setK()方法中指定的簇的数量,所以我想通过减少epsilon一点来增加生成的簇的数量。

有谁知道如何在新的Spark.ml Kmeans类中设置epsilon?

org.apache.spark.ml.clustering.KMeans

谢谢。

回答

1

的Epsilon在spark.ml库已被重命名为tol(简称公差)

实施例:

KMeans kmeans = new KMeans().setK(2).setSeed(1L).setTol(0.0001) 
KMeansModel model = kmeans.fit(dataset);