【发布时间】:2021-11-23 12:06:54
【问题描述】:
背景:
我有一个 Airflow 作业,每 10 分钟从第三方端点收集一次数据(过去 24 小时内的行业市场份额)。我目前将数据存储在 S3 中。我们想用这些数据来计算我们的市场份额。我计划将数据仓库中的数据保留为时间序列独立表(不是维度或事实),用于查询以将其与我们的数据(存储在星型模式中)进行比较,以获得每日市场份额。
问题:
数据仓库是存储时间序列数据的正确位置吗?我们可以存储类似这样的独立表吗?表是否需要成为星型模式的一部分才能将其保存在数据仓库中?
【问题讨论】:
标签: time-series snowflake-cloud-data-platform data-warehouse