【发布时间】:2020-08-16 09:30:39
【问题描述】:
假设我们有一个这样的python字典:
dict = {"person1" : (20, 17, 157, 31, 35), "person2" : (29 , 11) , "person3" : (200, 100 , 11)}
如何根据这个字典在 pyspark 中创建一个 Dataframe,它有不同大小的字符串键和元组作为其值?
我想要的输出是这样的:
key | value
-------------------------------------
person1 | (20, 17, 157, 31, 35)
------------------------------------
person2 | (29 , 11)
-------------------------------------
person3 | (200, 100 , 11)
我试图用这段代码做到这一点:
df = pd.DataFrame(dict)
ddf = spark.createDataFrame(df)
但它会引发这样的值错误:
ValueError: 数组的长度必须相同
谁能给我建议?
【问题讨论】:
-
您预期的输出数据帧是什么?
-
@Shu 我编辑了我的答案并显示了我的预期输出。
标签: python dataframe dictionary pyspark