【问题标题】:Add empty column to dataframe in Spark with python使用python将空列添加到Spark中的数据框
【发布时间】:2016-05-19 10:41:25
【问题描述】:

我有一个数据框,我想用另一个数据框创建一个 unionAll。问题是第二个数据框比第一个数据框多三列。有没有办法让我在我的第一个数据框中添加只有空单元格的三列?

【问题讨论】:

标签: pyspark rdd spark-dataframe


【解决方案1】:

使用 spark-dataframe 的 withColumn 对象
DF.withColumn("NewCol","Value")

【讨论】:

  • 如何将值设为 blanc 列?
  • 让它与 .withColumn('NewCol', lit(None).cast(StringType())) 一起使用
  • 我听不懂你的意思。
【解决方案2】:

df.withColumn('NewColumn', lit(None).cast(StringType()))

【讨论】:

  • 如果我在此声明之后执行 df.fillna(0)。它不起作用
【解决方案3】:

也许这会有所帮助

添加字符串类型列:

from pyspark.sql.types import StringType

df.withColumn("COL_NAME", lit(None).cast(StringType()))

添加整数类型

from pyspark.sql.types import IntegerType

df.withColumn("COL_NAME", lit(0).cast(IntegerType()))

【讨论】:

  • 只是一个观察:在您的第二个示例中,导入的类型与使用的转换类型不匹配。
  • 谢谢,已更改
猜你喜欢
  • 2017-06-16
  • 2014-12-28
  • 2016-03-21
  • 2019-01-03
  • 1970-01-01
  • 2013-04-25
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多