【发布时间】:2020-11-05 10:23:36
【问题描述】:
我在 DF 下的某些列中有空值。
现在我需要用 'NA' 更新/替换那些 'null' 值
+-------+------+-----+------+----+
|Product|Canada|China|Mexico| USA|
+-------+------+-----+------+----+
| Orange| null| 4000| null|4000|
| Beans| null| 1500| 2000|1600|
| Banana| 2000| 400| null|1000|
|Carrots| 2000| 1200| null|1500|
+-------+------+-----+------+----+
我找到了'fillna'方法来替换空值
但是我需要更新/替换所有具有空值的列
所以像这样或更好的方法
replaced = df.fillna({str(col):'NA', col for col in df.columns})
感谢任何帮助以获取正确的方法
谢谢
【问题讨论】:
-
这些列的数据类型是什么(除了产品)?可以添加架构吗?
标签: apache-spark pyspark apache-spark-sql pyspark-dataframes