0

我正在测试Scikit Learn中实现的Birch clustering算法。我对手册中的陈述有点困惑;关于参数n_clusters,它指出了解Scikit中Birch集群的设置了解

n_clusters : int, instance of sklearn.cluster model, default None 

在另一方面,该算法的初始描述如下:

类sklearn.cluster.Birch(阈值= 0.5,branching_factor = 50, n_clusters = 3,compute_labels =真,副本= TRUE)

我会认为这意味着该n_clusters是默认设置为,而不是。这也是我运行它时似乎在做的事情。

我是否以某种方式误读了这篇文章?这背后的逻辑是什么?

(我想这没有帮助,我不是100%肯定这是什么设置实际上做;我理解它是一种额外的细集群适用于桦木方法的结果。)

任何非常感谢帮助!

+0

Oh noes!文档错误!我们注定要失败,我们必须问在interwebz上的随机网站现在该做什么!我的电脑现在会爆炸。 –

回答

0

是的,你是对的。默认值应该是3而不是无。

n_clusters = integer时,模型拟合变为Agglomerative Clustering,其n_clusters被设置为该值integer的值。

n_clusters = None时,未执行进一步的群集步骤,并且子群集返回为以前的样子。

See #6635 github issue

+1

谢谢!很高兴这不仅仅是我愚蠢...... – patrick