【发布时间】:2015-11-18 09:07:11
【问题描述】:
在执行一些较早的计算之后,我试图将两个 DataFrame 相互连接。命令很简单:
employee.join(employer, employee("id") === employer("id"))
但是,join 似乎执行 carthesian join,完全忽略了我的 === 声明。有谁知道为什么会这样?
【问题讨论】:
-
欢迎来到 SO NNamed。如果您需要帮助,您应该给我们一个机会 :) 最好的起点是提供 Minimal, Complete, and Verifiable example。
标签: scala apache-spark pyspark apache-spark-sql