【问题标题】:mathematical opération with pyspark用 pyspark 进行数学运算
【发布时间】:2016-08-21 13:45:32
【问题描述】:

我在 rdd 中有一个结构,其中包含这样的记录时间:02:00:30。 我想将数据从这种格式转换为第二种格式,我想做这个处理:02 * 3600 + 00 * 60 + 30 有人可以帮我在 pyspark 中进行这种治疗吗?提前谢谢你。

【问题讨论】:

标签: pyspark


【解决方案1】:

映射它

rdd=rdd.map(lambda row: [3600*int(row[0].split(':')[0])+60*int(row[0].split(':')[1])+*int(row[0].split(':')[2]))

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-07-28
    • 1970-01-01
    • 1970-01-01
    • 2017-08-07
    • 2011-08-18
    • 2016-01-20
    • 2011-04-06
    • 1970-01-01
    相关资源
    最近更新 更多