【发布时间】:2015-10-13 17:44:57
【问题描述】:
我们正在存储来自多个测量设备的大量时间序列数据。 所有设备都可能提供不同的维度(能量、温度等)
目前我们使用 MySQL 将所有这些数据存储在不同的表中(根据维度),格式为 idDevice, DateTime, val1, val2, val3
每次我们插入新数据时,我们还会从 min -> Hour -> Day -> Month -> Year 聚合这些数据
这运行得很好,但是随着我们的增长,我们的磁盘空间已经用完了,总的来说,我怀疑 RDBMS 是否是保存存档数据的正确答案。
所以我们正在考虑在 Amazon S3 上移动旧/冷数据并编写一些可以接收这些数据的奇特 getter。
所以我的问题来了:什么是支持以下需求的好数据格式:
数据必须是可扩展的:有时设备会提供更多数据,然后在过去 -> 行数可以增长/增加
必须更新数据。当客户提供历史数据时,我们需要能够更新过去的数据。
我们正在使用 PHP -> 有连接器/类会很好:)
我看过 HDF5,但似乎没有 PHP 库。 我们也愿意看看基于云的时间序列数据库。
提前感谢您! 乙
【问题讨论】:
-
你有多少数据?如今,磁盘空间并不是特别昂贵。
-
目前我们即将达到 1TB,但我们的预测似乎在明年达到 4TB。我们的目标也是在 S3 等云服务上扩展数据
标签: mysql amazon-s3 time-series hdf5 influxdb