我在飞机上(城市)多点(经度和纬度),我想找到两个群集。集群1点杂乱无章,集群2就是其他的一切。在飞机上发现非常接近点 - 近似聚类算法需要
我知道这个问题的界定不准确。唯一定义的是我需要恰好2个集群。在N个点中,没有定义在群集1或群集2中结束的数量。
主要目的是确定这是非常接近对方的点,并将它们与其他人区分开(这是更更均匀地分布)
我能想到的最好的是下面的算法:
1. For each point, Calculate the sum of the square distances to all other points.
2. Run the k-means with k=2 on these square distances
距离的平直(或甚至更高阶)应通过提高维帮助。然而,这种算法将偏向城市中心附近的点。它将很难在城市的边缘找到群集。
如何避免这个问题有什么建议?和任何其他建议,以提高该算法
也许这一个可以帮助你:http://stackoverflow.com/questions/17112719/how-can-i-find-the-center-of-a-cluster-of-data-points – Regenschein
是否需要群集1成为一个连通的空间?在街道的感觉(没有第2组点)或点类似的东西(没有第2类的点)? – Galigator
@fordprefect哇,我希望它会比答案中提供的描述更简单。由于我不是数学家,因此需要一些时间才能掌握所说的内容。 – arahant