【发布时间】:2018-03-15 14:15:00
【问题描述】:
我开始使用 Scala 和 Spark。目前,我使用一个 Rest 服务,并根据响应从 JSON 生成一个数据集,其结构如下:
| id | name | key |
+------- + -------------- + ------------------- +
| 128b16 | sample_project | uk.uda.proyect: ... |
从这个数据集中,我需要遍历它的行,并为每个“关键”元素使用另一个 Rest 服务(每行一个调用)并将所有行的响应保存在一个新数据集中,例如,像这样:
| key | value_1|value_2|value_n ... |
+ ------ + -------+------ + ---------- +
| 128b16 | xxxxxx | xxxx | xxxx |
请知道我是如何做到这一点的吗?
【问题讨论】:
标签: scala apache-spark apache-spark-sql spark-dataframe