【发布时间】:2017-11-28 20:46:28
【问题描述】:
我有一种情况,我的 rdd 键在每个字典中都不同,有些具有比其他更多和不同的键。
因此,我无法使用toDF() 直接隐藏它们。有人有更好的主意吗?
list1 = [{'this':'bah', 'is': 'bah'},
{'this': 'true', 'is': 'false'},
{'this': 'true', 'is': 'false', 'testing':'bah'}]
rdd = sc.parallelize(list1)
rdd.map(lambda x: Row(**x)).toDF().show()
【问题讨论】:
标签: python apache-spark pyspark spark-dataframe