时间序列数据的关系数据库答案

【问题标题】：Relational Database for Time Series Data时间序列数据的关系数据库
【发布时间】：2014-02-07 11:31:32
【问题描述】：

我目前正在尝试设计一个数据库来存放生产测试数据。每个单元都经过相同的测试序列（12 次测试），在每次测试运行期间以不同的采样率从许多位置收集电压、电流和温度数据。目标是通过测试类型和参数使用数据进行趋势分析，以确定一个单元是否“在家庭中”。

我的第一个想法是让一个“单位”表链接到一个“测试”表，该表链接到一个“参数”表，该表将链接到该特定运行的原始数据关系数据库是否是最好的做这样的事情的方法还是我最好为这个应用程序使用像 MongoDB 这样的东西？

【问题讨论】：

Mongo 并不是真正的数据库。如果顶级文档彼此独立，但包含大量高度结构化的数据，这些数据在文档内部而不是文档外部相关，那么 Mongo 可能是答案。对于要对非层次关系建模的其他任何事情，请坚持使用真正的关系数据库。为了获得更好的答案，请提供一些您想要存储的示例。
@JimGarrison “数据库是有组织的数据集合。” (en.wikipedia.org/wiki/Database) 根据这个定义，Mongo 无疑是一个数据库。在回答这个问题时，经典答案适用：视情况而定。这真的很难说，因为我们不知道您将如何处理您的数据。对于这样的科学数据，如果我认为额外的表不会给我带来太多收益，我可能会考虑将所有内容都放入一个具有一些良好索引的表中。考虑一下您需要对数据实施哪些类型的完整性约束，以及您将运行哪些类型的查询。
Storing time-series data, relational or non?的可能重复

【解决方案1】：

传统的 RDBMS 仍然是您的默认选择。像 MongoDB 这样的“NoSQL”系统通常只有在关系数据库无法满足您的要求时才会使用。

关系数据库可能无法使用的两种典型情况是：

也有可能是数据量太大，但这意味着很多数据。

在您的情况下，听起来数据是高度结构化的并且以合理的速度到达（您接收数据点的速度不会比可以测试的物理单位快）。此外，听起来整个系统不会有沉重的并行负载（意味着许多用户同时运行查询）。

在这种情况下，您可能希望利用传统关系系统提供的内置完整性维护机制（类型化列、检查约束等）、大量文档等。

正如您在问题中提到的，为您的数据设计一个可行的架构绝对是可能的。

【讨论】：