【发布时间】:2018-05-03 18:29:40
【问题描述】:
我想要两个连接两个数据集 DS1 和 DS2 得到 DS3
DS1:
+---------+--------------------+-----------+------------+
|Compte | Lib |ReportDebit|ReportCredit|
+---------+--------------------+-----------+------------+
| 447105|Autres impôts, ta...| 77171.0| 0.0|
| 753000|Jetons de présenc...| 6839.0| 0.0|
| 511107|Valeurs à l’encai...| 0.0| 77171.0|
+---------+--------------------+-----------+------------+
DS2:
+---------+------------+
|Compte |SoldeBalance|
+---------+------------+
| 447105 | 992.13|
| 111111 | 35065.0|
我想得到这样的 DS3:
+---------+--------------------+-----------+------------+------------+
|Compte | CompteLib|ReportDebit|ReportCredit|SoldeBalance|
+---------+--------------------+-----------+------------+------------+
| 447105|Autres impôts, ta...| 77171.0| 0.0| 992.13|
| 753000|Jetons de présenc...| 6839.0 | 0.0| 0.0|
| 511107|Valeurs à l’encai...| 0.0| 77171.0| 0.0|
111111| | 0.0| 0.0| 35065.0|
+---------+--------------------+-----------+------------+------------+
有人可以用示例 Spark Java 表达式指导我吗? 提前致谢。
【问题讨论】:
-
欢迎来到 Stack Overflow。您已经发布了一个小时的exactly the same question,该帖子已作为副本关闭。请不要通过删除和重新发布问题来滥用该网站。如果重复没有回答您的询问,edit 问题,并描述您遇到的问题。还要确保遵循How to ask 的说明并提供可重现的示例(minimal reproducible example,Repr. Spark Example)
标签: java apache-spark hadoop apache-spark-sql