【问题标题】:rename columns in dataframe pyspark adding a string重命名数据框pyspark中的列添加字符串
【发布时间】:2018-12-24 21:08:46
【问题描述】:

我使用 Pandas 在 Python 中编写了代码,将“VEN_”添加到列名的开头:

Tablon.columns = "VEN_" + Tablon.columns

它工作正常,但现在我正在使用 PySpark,但它不起作用。 我试过了:

Vaa_total.columns = ['Vaa_' + col for col in Vaa_total.columns]

for elemento in Vaa_total.columns:
    elemento = "Vaa_" + elemento

还有其他类似的东西,但它不起作用。

我不想替换列名,我只想保留它,但在开头添加一个字符串。

【问题讨论】:

  • 我不这么认为,解释了如何替换它,但我不知道如何在列名中添加字符串,我得到:AttributeError:无法设置属性.
  • 查看选项 2 或 3。这正是您所需要的。
  • 是的,你是对的!

标签: dataframe pyspark


【解决方案1】:

试试这样的:

for elemento in Vaa_total.columns:
    Vaa_total =Vaa_total.withColumnRenamed(elemento, "Vaa_" + elemento)

【讨论】:

    【解决方案2】:

    我在评论中链接了类似的主题。 这是从该主题改编为您的任务的示例:

    dataframe.select([col(col_name).alias('VAA_' + col_name) for col_name in dataframe])
    

    【讨论】:

      猜你喜欢
      • 2019-03-27
      • 1970-01-01
      • 1970-01-01
      • 2016-05-11
      • 2022-06-14
      • 2020-08-31
      • 2015-09-25
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多