2016-03-03 77 views
0

我有一个客户位置流式传输数据,如果位置是他通常访问的位置,我需要分析和检查每个事件,如果不是他通常访问的位置,则实时生成警报。 我正在寻找各种聚类算法,但找不到一个能够“实时”处理的算法。地理位置集群

K均值是centriods的数量过于死板.. DBSCAN是沉重的重量,不知道它的速度不够快的实时响应...

您能否提供一个,它适合实时流处理?

+0

一个好的DBSCAN实现可以很好地扩展。 –

回答

0

我相信DBSCAN已经够用了。其最坏情况下的复杂度为O(n2),与其他传统算法(如分层结构)相比,它足够体面。与kmeans相比,如果您使用来自空间数据库(如SpatiaLIte或PostGIS)的ST_Centroid函数(理所当然地使用地理数据),我相信kmeans是适用的。 在kmeans和DBSCAN之间,我选择DBSCAN,因为我认为您的问题的答案是关于实时数据的基于密度的方法。