我有两个点feat_left, feat_right
获得从连体网络和我绘制这些点在x,y
坐标如下所示。 计算质心和精度
这里是python脚本
import json
import matplotlib.pyplot as plt
import numpy as np
data = json.load(open('predictions-mnist.txt'))
n=len(data['outputs'].items())
label_list = np.array(range(n))
feat_left = np.random.random((n,2))
count=1
for key,val in data['outputs'].items():
feat = data['outputs'][key]['feat_left']
feat_left[count-1] = feat
key = key.split("/")
key = int(key[6])
label_list[count - 1] = key
count = count + 1
f = plt.figure(figsize=(16,9))
c = ['#ff0000', '#ffff00', '#00ff00', '#00ffff', '#0000ff',
'#ff00ff', '#990000', '#999900', '#009900', '#009999']
for i in range(10):
plt.plot(feat_left[label_list==i,0].flatten(), feat_left[label_list==i,1].flatten(), '.', c=c[i])
plt.legend(['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'])
plt.grid()
plt.show()
现在我想计算质心然后纯度每个集群的。
如何定义群集的“准确性”? – Shai
您可以使用k-means(k = 10),或查看模块sklearn.cluster提供的不同[clustering method](http://scikit-learn.org/stable/modules/clustering.html) ' – Nuageux
我正在关注这篇文章[集群评估](https://nlp.stanford.edu/IR-book/html/htmledition/evaluation-of-clustering-1.html)@Shai – cpwah