【发布时间】:2017-01-28 06:42:06
【问题描述】:
我是 pyspark 的新手,我正在尝试将 python 中的列表转换为 rdd,然后我需要使用 rdd 查找元素索引。对于我正在做的第一部分:
list = [[1,2],[1,4]]
rdd = sc.parallelize(list).cache()
所以现在 rdd 实际上是我的列表。问题是我想找到任何任意元素的索引,比如适用于 python 列表的“索引”函数。我知道一个名为 zipWithIndex 的函数,它为每个元素分配索引,但我在 python 中找不到合适的例子(有 java 和 scala 的例子)。
谢谢。
【问题讨论】:
-
任意元素是指任意子列表,如
[1,2]? -
@AkshatMahajan 是的,这就是我的意思