【发布时间】:2017-07-26 18:23:51
【问题描述】:
场景: 我有几个气象站正在收集数据。数据大约每 15 分钟左右出现一次。每个数据包都包含多个测量值,例如压力、温度、湿度等。
可以通过多种方式查询数据:
- 显示站点所有测量值的最新值
- 显示单次测量的历史图表(例如温度)
- 其他?
建议表:
STATIONS: hash-key: station-id
包含有关电台的元数据信息
STATION_X_MEASUREMENT_DATA:哈希键:测量类型,范围键:时间戳
其中 X 是电台 ID。每条记录都包含特定测量类型和时间的测量值。每个站点都有自己的数据表,因此当站点不再服务时,可以通过删除表来删除数据。
STATION_SUMMARY:哈希键:station_id
包含每个站点所有测量类型的最新/当前值
问题:
我应该有两个单独的表(汇总和单独的测量值),还是在我想显示汇总时只查询最新的测量值?
我应该将测量类型存储为单独的记录,还是合并为特定时间戳的单个记录?
如果我要将所有测量值存储在以时间戳作为范围键的组合记录中,是否值得使用分钟或秒作为分区键?恐怕这会使查询变得更加复杂。
还有什么我应该改变/改进的吗?有更好的选择吗?
【问题讨论】:
标签: time-series amazon-dynamodb