【发布时间】:2019-02-14 06:17:26
【问题描述】:
Microsoft 流程看起来像是将数据从 SQL Server 复制到 Azure 数据仓库的批量导入方法。
是否有更简单的方法,将每秒的流数据从 MS SQL Server 传输到 Datawarehouse。这对于两个 ETL 步骤(Azure 数据工厂,然后是 Polybase)来说似乎过于复杂。我们能否不断地将数据从 SQL Server 流式传输到数据仓库? (我们知道 AWS 允许将数据从 SQL 服务器流式传输到 Redshift DW)。 Stream Data from SQL Server into Redshift
https://azure.microsoft.com/en-us/services/sql-data-warehouse/
【问题讨论】:
-
我的意思是 Polybase 是数据工厂中的一个复选框,因此您不需要做很多额外的工作。它之所以存在,是因为它是推荐的将数据导入 Azure SQL 数据仓库的最快方式。 ADW 是一种昂贵的产品,可以保持 24x7 全天候运行,因此您只需将数据“流式传输”(复制)到 Data Lake 中,并在其上创建一个外部 Polybase 表。如果需要,在仓库启动时使用 CTAS 将其具体化到仓库中。
标签: sql-server azure azure-sql-database data-warehouse azure-data-factory