【发布时间】:2019-09-20 19:18:05
【问题描述】:
我想创建一个时间戳列,以从分别包含月份和年份的两列创建折线图。 df 看起来像这样: 我知道我可以创建一个字符串 concat 然后将其转换为日期时间列:
df.select('*',
concat('01', df['month'],
df['year']).alias('date')).withColumn("date",
df['date'].cast(TimestampType()))
但我想要一种使用内置 PySpark 功能的更简洁的方法,该功能还可以帮助我创建其他日期部分,如周数、季度等。有什么建议吗?
【问题讨论】:
标签: pyspark