【发布时间】:2020-01-11 23:47:10
【问题描述】:
我正在考虑在我的工作场所建立混合云设置。现在,我们在 AWS 上的 Spark 集群上运行机器学习作业。我想要做的是能够从 GCP 上运行的 Airflow 作业连接到该集群,以便根据需要调用各种作业并执行其他任务。
不过,我不知道该怎么做。我可以为 Spark 集群创建一个公共 DNS,这样可以很容易地通过 Internet 从 GCP 进行连接,但我认为这对于安全性来说并不理想。
我是否需要在 GCP 项目(即 GCP VPC)和 AWS VPC 之间设置 VPN?如果是这样,我该怎么做?如果有办法通过 vanilla GCP 和 AWS 配置做到这一点,我不想使用 3rd 方产品。
基本上,我认为我需要让 GCP 上的工作能够看到 Spark 集群的内部 DNS 并能够使用它进行连接,但我还是不知道该怎么做。
【问题讨论】:
-
AWS和GCP都有VPN的概念。我过去按照这个秘诀在两者之间建立了私人网络。 cloud.google.com/files/…
标签: amazon-web-services google-cloud-platform