【发布时间】:2021-11-21 14:25:23
【问题描述】:
我尝试将 dicts 列表转换为 Databricks 的 Koalas DataFrame,但我不断收到错误消息:
ArrowInvalid:不能混合列表和非列表、非空值
Pandas 可以完美运行(使用 pd.DataFrame(list)),但由于公司限制,我必须使用 PySpark/Koalas。 我也尝试将列表转换为字典,但错误仍然存在。
列表示例:
[{'A': None,
'B': None,
'C': None,
'D': None,
'E': [],
...},
{'A': data,
'B': data,
'C': data,
'D': data,
'E': None,
...}
]
字典是这样的:
{'A': [None, data, [], [], data],
'B': [None, data, None, [], None],
'C': [None, data, None, [], None],
'D': [None, data, None, [], None],
'E': [[], None, data, [], None]}
是否可以从中获取 DataFrame? 谢谢
【问题讨论】:
-
似乎发生了错误,因为您的记录中有两个空列表,
[]和None值。是否允许修改数据?在将[]元素替换为None后,我能够使用您的数据创建一个 Koalas DataFrame。
标签: python pandas dataframe pyspark spark-koalas