我正在研究一个项目,我们每天导入50k-100k个数据点,位于时间上(YYYYMMDDHHmm)和空间上lon,lat),然后根据我们用户设置的查询参数动态呈现到地图上。我们确实使用低于给定缩放级别的预先计算的群集。时空系列的复合分区键(Cassandra)与交错索引(Accumulo,BigTable)
在这种情况下,鉴于我们正在为我们的存储层选择数据库引擎,我目前正在评估Cassandra和BigTable的变体。
具体而言,我试图理解在卡桑德拉与在BigTable的交织索引关键字,如一个GeoMesa使用利用复合分区键之间的差。
据我所知,这两种方法都可以利用COTS硬件,并且可以进行调整以减少热点并最大化空间填充。
我应该遵循什么逻辑步骤来区分两者?尽管我计划在不久的将来对两种方法进行测试,但我希望听到更合理,更有教养的方法。