【发布时间】:2019-02-18 11:07:29
【问题描述】:
我有一个 SQL 服务器数据库,每天都有数百万行(插入/删除/更新)。我应该提出一个 ETL 解决方案来将数据从这个数据库传输到数据仓库。起初我尝试与 CDC 和 SSIS 合作,但我工作的公司想要一个更实时的解决方案。我做了一些研究并发现了流处理。我也找过 Spark 和 Flink 教程,但没有找到任何东西。
我的问题是我选择哪种流处理工具?以及如何学习使用它?
【问题讨论】:
标签: sql-server apache-spark etl apache-flink business-intelligence