Databricks 上的 Apache Spark | AWS 上的 Databricks这是 [截至 2022 年 10 月 25 日] 的翻译。

本文件为删节译文,不保证内容的准确性。具体内容请参考原文。

本文档解释了 Apache Spark、Databricks 和 Databricks Lakehouse 平台之间的关系。

Apache Spark 是 Databricks Lakehouse 平台的核心,该技术为平台的计算集群和 SQL 仓库提供支持。 Databricks 是一个 Apache Spark 优化平台,为运行 Apache Spark 工作负载提供了一个高效且简单的平台。

Apache Spark 和 Databricks 之间有什么关系?

一家名为 Databricks 的公司由 Apache Spark 的原始创建者创立。 Apache Spark 包含作为开源软件项目的 Databricks来自许多*公司的提交者

Databricks 继续开发 Apache Spark 并发布功能。 Databricks 运行时包括基于 Apache Spark 的进一步优化和专用功能以及用 C++ 重建的 Apache Spark 优化版本。光子包括 Apache Spark 的增强版本,其中包括

Apache Spark 如何在 Databricks 上运行?

每当您在 Databricks 上部署计算集群或 SQL 仓库时,都会在虚拟机上配置和部署 Apache Spark。由 Databricks 管理,您无需担心设置或初始化 Spark 上下文或 Spark 会话。

是否可以在不使用 Apache Spark 的情况下使用 Databricks?

Databricks 支持许多工作负载,并在 Databricks 运行时中包含许多开源库。 Databrikcs SQL 在后台使用 Apache Spark,但最终用户使用标准 SQL 语法来查询数据库对象。

Databricks 机器学习运行时针对 ML 工作负载进行了优化,许多数据科学家在使用 Databricks 时会使用 TensorFlow 和 SciKit Learn 等领先的开源库。利用工作流针对 Databricks 部署和管理的计算资源安排任意工作负载。

为什么 Databricks 使用 Apache Spark?

Databricks Lakehouse 平台提供了一个安全的协作环境,用于开发和部署可扩展业务的企业解决方案。许多 Databricks 员工都是知识最渊博的 Apache Spark 维护者和世界各地的用户。我们不断开发和发布新的优化,为我们的用户提供运行 Apache Spark 的最快环境。

Databricks 免费试用

Databricks 免费试用


原创声明:本文系作者授权爱码网发表,未经许可,不得转载;

原文地址:https://www.likecs.com/show-308632019.html

相关文章: