【发布时间】:2018-09-08 11:42:49
【问题描述】:
我的数据框有 3 列,在这三列中,column3 中可能存在空值。此 DF 中的总记录为 200 万。 我需要通过 mysql 数据库中的值填充这个空值(基本上调用一个返回值的函数)。我可以考虑遍历每一行,但考虑到数据量,这可能会更耗时。 我怎样才能做到这一点,我知道如何用静态值填充空值,但这完全是动态的。 谢谢您的帮助 问候, 罗宾
【问题讨论】:
-
你想用你的函数返回的单个值替换 null 或者我错误地解释了这个问题
-
该函数每次调用时都会返回一个不同的值。这将返回一个序列,我需要将它们分配给每一行。
标签: pyspark