【发布时间】:2018-12-06 20:58:33
【问题描述】:
我已经创建了如下所示的rdd
rdd=sc.parallelize([('AA', 44),('BB', 53),(('AA', 'Bb'), 23), (('AD', 'AC'), 23),(('AA', 'BB', 'CC'), 2)])
我想将元组键转换为字符串。
我的预期输出如下new_rdd.collect() 应该给出:
[('AA', 44),('BB', 53),('AA,Bb', 23),('AD,AC', 23),('AA,BB,CC',2)]
【问题讨论】:
标签: python apache-spark pyspark rdd