【发布时间】:2016-11-07 14:45:12
【问题描述】:
为什么列1st_from_end 包含null:
from pyspark.sql.functions import split
df = sqlContext.createDataFrame([('a b c d',)], ['s',])
df.select( split(df.s, ' ')[0].alias('0th'),
split(df.s, ' ')[3].alias('3rd'),
split(df.s, ' ')[-1].alias('1st_from_end')
).show()
【问题讨论】:
标签: apache-spark pyspark apache-spark-sql