1
例如,我有一个数据集X = {1,1.5,5,3,4,3},Y = {1,1.5,5,4,4,3.5} 。我做的是 -测试R中Kmeans聚类中的未知数据
data <− read . csv (”exp . csv”)
print (data)
results <− kmeans(data , 2)
results
results $ size
results $ cluster
plot (temp [ c(”X” , ”Y”) ] , col=results $ cluster)
现在我想检查假设(1,1)是在哪个集群?我怎样才能做到这一点?
'结果$ cluster'具有指示集群membersh标签ip,在你的情况下为'1,1,2,2,2,2',即前两个观察值属于簇1,其余为簇2 – OdeToMyFiddle
欢迎来到SO。这是一个有趣的问题,但它可能更适合交叉验证。编程方式,答案是否定的(我认为)。但支持验证kmeans算法的统计数据可能会有更多的答案。 –