【发布时间】:2018-02-27 09:27:30
【问题描述】:
我想在 pyspark 数据框中的每个列的值上附加一个单词(例如来自单词列表)。我想只是将它转换为 pandas 框架,因为它更容易,但我需要在 pyspark 上进行。有任何想法吗?谢谢:)
【问题讨论】:
-
请展示您尝试过的内容。
我想在 pyspark 数据框中的每个列的值上附加一个单词(例如来自单词列表)。我想只是将它转换为 pandas 框架,因为它更容易,但我需要在 pyspark 上进行。有任何想法吗?谢谢:)
【问题讨论】:
您可以使用concat 函数轻松完成:
from pyspark.sql import functions as F
for col in df.columns:
df.withColumn(col, F.concat(F.col(col), F.lit("new_word"))
【讨论】: