【发布时间】:2019-07-14 14:49:03
【问题描述】:
我想使用 spark DataFrame 创建一个非 hdfs .csv 文件。怎么可能呢?
这个非 hdfs .csv 文件的目的是在其上使用 read_csv() 并将其加载回 pandas DataFrame。
我尝试使用 toPandas(),但我的 spark DataFrame 中有 4500 万条记录,而且速度非常慢。
【问题讨论】:
标签: python-3.x pandas apache-spark pyspark pyspark-sql