【发布时间】:2022-01-21 17:11:04
【问题描述】:
处理需要我从一个 postgres 表中提取数据并将数据更新到另一个环境中的另一个 Postgres 表的 ETL 过程(相同的列名)。目前,我正在 Windows EC2 实例中运行 python 作业,并且我正在使用 pangres upsert 库来更新现有行并插入新行。
但是,我的组织希望我在 AWS 上的托管 Apache Airflow 中移动 python ETL 脚本。
我一直在学习 DAG,大部分教程和文章都是关于使用钩子或运算符从 postgres 表中查询数据。
但是,我希望了解如何使用表 B 中的新记录(并忽略/覆盖现有匹配行)以增量方式(即 upsert)更新现有表 A。
任何解释如何执行这个简单任务的代码块 (DAG) 都会非常有帮助。
【问题讨论】:
标签: postgresql amazon-web-services airflow etl mwaa