【发布时间】:2026-01-23 10:25:02
【问题描述】:
我正在做一个项目,我们每天导入 50k - 100k 个数据点,位于时间 (YYYYMMDDHHmm) 和空间 (lon, lat),然后我们根据我们设置的查询参数动态呈现到地图上用户。我们确实使用低于给定缩放级别的预计算集群。
在这种情况下,鉴于我们正在为存储层选择数据库引擎这一事实,我目前正在评估 Cassandra 和 BigTable 的变体。
具体来说,我试图了解在 Cassandra 中使用复合分区键与在 BigTable 中使用交错索引键之间的区别,例如 GeoMesa 使用的那个。
据我了解,这两种方法都可以利用 COTS 硬件,并且可以进行调整以减少热点并最大限度地填充空间。
为了区分两者,我应该遵循哪些合乎逻辑的步骤?尽管我计划在不久的将来测试这两种方法,但我希望听到更合理和更有教育意义的方法。
【问题讨论】:
标签: cassandra time-series geospatial bigtable geomesa