【发布时间】:2018-08-10 00:32:16
【问题描述】:
我在pyspark中处理了一些数据,它是一个具有这种结构的RDD
[(u'991', {'location': 'Australia', 'Age': '27', 'Colour': Pink}), (u'993', {'location': 'Singapore', 'Age': '55', 'Colour': Black}), (u'993', {'location': 'Mexico', 'Age': '12', 'Colour': Blue}), (u'994', {'location': 'USA', 'Age': '24', 'Colour': Red})]
如何将此结构转换为 Dataframe?我的最终目标是我可以存储一个带有 4 列(ID(即 991)、位置、年龄、颜色)的配置单元表
鉴于字典在元组中,Row 解决方案似乎不起作用
【问题讨论】:
标签: python dictionary apache-spark dataframe rdd