【发布时间】:2015-06-23 15:02:02
【问题描述】:
这是一道作业题:
我有一个RDD,它是一个 os 元组的集合。我也有从每个输入元组返回字典的函数。不知何故,与 reduce 函数相反。
使用 map,我可以轻松地从 RDD 的元组转到 RDD 的字典。但是,由于字典是 (key, value) 对的集合,我想将字典的 RDD 转换为每个字典内容的 (key, value) 元组的 RDD。
这样,如果我的RDD 包含 10 个元组,那么我会得到一个 RDD,其中包含 10 个具有 5 个元素的字典(例如),最后我会得到一个包含 50 个元组的 RDD。
我认为这必须是可能的,但是,如何? (可能问题是我不知道这个操作英文怎么叫)
【问题讨论】:
标签: python apache-spark pyspark