【发布时间】:2018-01-29 01:59:50
【问题描述】:
这是我上一个问题的延续。
我正在尝试使用 pyspark 查找以下 RDD 的“e”的索引:
['a,b,c,d,e,f']
我正在使用的方法:
rdd.zipWithIndex().lookup('e')
但我得到 = []
因为 Rdd 的形式是: [ ['a,b,c,d,e,f']
我试过了
rdd.flatMap(lambda x: x)
所以我使用查找来获取索引,但我仍然得到 []
请帮助我。我如何获得 Rdd 为:
['a','b','c','d','e','f']
这样我就可以做这个方法了
rdd.zipWithIndex().lookup('e')
【问题讨论】:
-
我试过这个方法。但是为了获得索引,我需要它的形式: ['a','b','c','d','e','f'] 。我该怎么做
标签: python apache-spark pyspark row rdd