【发布时间】:2018-11-16 20:18:26
【问题描述】:
我是时间序列数据库设计的新手。
我读过的指导原则之一是避免大量时间序列(例如InfluxDb recommendations)或短暂/消亡的时间序列。
作为练习,我正在尝试对 github 存储库的指标进行建模。我想跟踪由各种属性聚合的 cmets / commits / changed 行的总数。我最初的想法是在每个拉取请求上推送指标,并通过查询进行所有聚合。
{
labels: {
pr: 1234,
repo: aRepo,
author: personA
}
values: {
commits: 5,
changed_files: 2,
comments: 0
status: Open
}
}
但这似乎与建议背道而驰(拉取请求被关闭并变得恒定)。另一种方法是在将聚合推送到数据库之前预先计算聚合。但是,这会导致数据粒度更小,并且会丢失数据。
对于临时时间序列的情况,这里的最佳策略是什么。
【问题讨论】:
标签: database-design time-series influxdb prometheus