【发布时间】:2019-08-19 02:01:26
【问题描述】:
我们正在使用 Apache Airflow 在 Google BigQuery 中构建数据仓库解决方案,以将 MySQL 表传输到云端。我每天都启动并运行以增量方式获取数据
MySQLToGoogleCloudStorageOperator => GoogleCloudStorageTBigQueryOperator
在 .sql 中使用该位:
WHERE timestamp BETWEEN '{{ macros.ds_add(ds, -1) }}' AND '{{ ds }}'
它运行良好,但我们有一个表,我们想在每月的 10 号每月更新一个表,但要从上个月的整个月中获取数据 - 所以当执行日期为 2019-03-10 运行时,我们想要获取
timestamp BETWEEN '2019-02-01 00:00:00' AND '2019-03-01 00:00:00'
等等。最好和最简单的方法是什么?
【问题讨论】:
标签: mysql google-cloud-platform google-bigquery airflow