【发布时间】:2016-08-21 13:45:32
【问题描述】:
我在 rdd 中有一个结构,其中包含这样的记录时间:02:00:30。 我想将数据从这种格式转换为第二种格式,我想做这个处理:02 * 3600 + 00 * 60 + 30 有人可以帮我在 pyspark 中进行这种治疗吗?提前谢谢你。
【问题讨论】:
-
欢迎来到 SO。请先查看此链接stackoverflow.com/help/how-to-ask
标签: pyspark
我在 rdd 中有一个结构,其中包含这样的记录时间:02:00:30。 我想将数据从这种格式转换为第二种格式,我想做这个处理:02 * 3600 + 00 * 60 + 30 有人可以帮我在 pyspark 中进行这种治疗吗?提前谢谢你。
【问题讨论】:
标签: pyspark
映射它
rdd=rdd.map(lambda row: [3600*int(row[0].split(':')[0])+60*int(row[0].split(':')[1])+*int(row[0].split(':')[2]))
【讨论】: