【发布时间】:2018-12-31 06:42:06
【问题描述】:
我已经使用 Pyspark 构建了一个决策树模型,我想使用 docker 容器部署该模型。我正在使用火花 1.6.0。数据存储在 Hive 表中,并且位于我的本地计算机中。有没有办法将 PySpark 从我的 docker 容器连接到我本地机器中的 hive 表?
我的 Hive 表中的数据可能会更新,因此我不想挂载驱动器或只是将文件夹从本地复制到我的容器,而是在 PySpark 和 Hive 表之间建立连接。
【问题讨论】: