【发布时间】:2022-03-03 23:59:13
【问题描述】:
我正在使用 saveAsTextFile() 将 Spark 作业的结果存储在文件夹 dbfs:/FileStore/my_result 中。
我可以使用网络浏览器访问不同的“part-xxxxx”文件,但我想将所有文件下载到本地计算机的过程自动化。
我曾尝试使用 cURL,但找不到用于下载 dbfs:/FileStore 文件的 RestAPI 命令。
问题:如何将 dbfs:/FileStore 文件下载到本地计算机?
我正在使用 Databricks 社区版在大学教授大数据分析的本科模块。我在本地机器上安装了 Windows 7。我已检查 cURL 和 _netrc 文件是否已正确安装和配置,因为我设法成功运行了 RestAPI 提供的一些命令。
非常感谢您的帮助! 此致, 纳乔
【问题讨论】:
标签: curl filesystems databricks