【发布时间】:2018-04-28 02:24:31
【问题描述】:
我需要将数据帧转换为 RDD,并需要对其应用一些核心操作。 试过下面的东西。它正在转换为列表、行或元组格式。但某些核心功能或不适用于 .split() 之类的功能。
尝试了以下方法:
df.rdd.map(list)
或
df.rdd.map(tuple)
或
df.rdd
我正在尝试的示例代码
rdd=load_df.rdd.map(list)
conv_rdd= rdd.map(lambda x:x.split(","))
需要从这里开始执行一些操作
【问题讨论】:
标签: python apache-spark dataframe pyspark