我有一组要分类的分类变量,所以我使用从github package取得的k模式。我想要得到每个观察点(点)到它所属群集的质心的距离。K模式计算每个点和簇质心之间的距离
这是我到目前为止执行:
kmodes_cao = kmodes.KModes(n_clusters=6, init='Cao', verbose=1)
kmodes_cao.fit_predict(data)
# Print cluster centroids of the trained model.
print('k-modes (Cao) centroids:')
print(kmodes_cao.cluster_centroids_)
# Print training statistics
print('Final training cost: {}'.format(kmodes_cao.cost_))
print('Training iterations: {}'.format(kmodes_cao.n_iter_))
我不能使用Eucledean距离自变量是分类。计算每个点到其簇质心距离的理想方法是什么?
看的源代码'KModes'功能。不要重新发明轮子。 –
我看穿它,但无法找到距离的计算方式。我是使用数据挖掘的新手,所以请你指导一下? –
甚至在文档中,'cat_dissim'参数。 –