【发布时间】:2017-11-17 09:28:37
【问题描述】:
100000,20160214,93374987
100000,20160214,1925301
100000,20160216,1896542
100000,20160216,84167419
100000,20160216,77273616
100000,20160507,1303015
我想读取第一行没有列名的 csv 文件。 如何阅读它并同时用我指定的名称命名列? 现在,我只是用我指定的名称重命名了原始列,如下所示:
df = spark.read.csv("user_click_seq.csv",header=False)
df = df.withColumnRenamed("_c0", "member_srl")
df = df.withColumnRenamed("_c1", "click_day")
df = df.withColumnRenamed("_c2", "productid")
还有更好的方法吗?
【问题讨论】: