【发布时间】:2017-04-25 07:06:16
【问题描述】:
是否可以将 pandas 数据框直接保存到 parquet 文件中? 如果不是,建议的流程是什么?
目的是能够将镶木地板文件发送给另一个团队,他们可以使用 scala 代码读取/打开它。谢谢!
【问题讨论】:
-
其他团队是否在使用 Spark 或其他一些 Scala 工具?加载 CSV 是 Spark 非常简单
-
如果你有
pyspark,你可以做类似this的事情
标签: python-3.x hdfs parquet