【发布时间】:2021-12-24 19:30:13
【问题描述】:
我没有使用 Azure Synapse 的经验,但我的理解是,这与 SQL DWH 中的 Databricks、ADF、ADLS2 和 Hive 相同,都在一个名称不同的工作区中。
我错了吗?
【问题讨论】:
标签: azure apache-spark azure-sql-database azure-databricks azure-synapse
我没有使用 Azure Synapse 的经验,但我的理解是,这与 SQL DWH 中的 Databricks、ADF、ADLS2 和 Hive 相同,都在一个名称不同的工作区中。
我错了吗?
【问题讨论】:
标签: azure apache-spark azure-sql-database azure-databricks azure-synapse
是的,在许多情况下,Azure Synapse 和 Databricks 提供相同的大数据分析方法,但这些服务之间也几乎没有区别。
现在,随着 Synapse 中的新功能,我们看到了一些与 Databricks 中相似的功能(例如 Spark、Delta),这引发了 Synapse 与 Databricks 的比较以及何时使用哪个的问题。
是的,两者都有 Spark,但是……
数据块
突触
是的,两者都有笔记本
突触
Nteract 笔记本
有共同创作的笔记本,但一个人需要在另一个人看到更改之前保存笔记本
没有自动版本控制
数据块
Databricks 笔记本
具有实时共同创作(两位作者实时看到更改)自动版本控制
是的,两者都可以访问数据湖中的数据
突触
数据块
是的,两者都利用 Delta
突触
数据块
不,它们不一样
突触
既有传统的 SQL 引擎(适合传统的 BI 开发人员)也有 Spark 引擎(适合数据科学家、分析师和工程师)
是数据仓库(即 Synapse Analytics)+ 接口工具(即 Synapse Studio)
数据块
不,它们提供的开发者体验不同
突触
目前仅通过 Synapse Studio(而非本地 IDE)为 Spark 开发提供开发者体验
Synapse Studio Notebooks 中尚未集成 Git
数据块
【讨论】: