【发布时间】:2019-08-05 18:05:09
【问题描述】:
我有一个网址,例如:
the_given_URL = https://blahblah.blahblah.com/raw/AAA/B_B_B/C-C/DD_DD/W/config/smth.json?token=AAArebNfNdB5Ypd9de2NH1ifSCzqA-aEks5dTcabwA%3D%3D
其中包含 Json 格式的数据,可能会定期更新。
我找不到将其转换为数据框的方法。 Scala 和 Pyspark 的方式都可能有所帮助。
我尝试过类似的东西
val df = sqlContext.read.json("the_given_URL")
但我收到以下错误:
19/08/05 17:43:13 WARN FileStreamSink: Error while looking for metadata directory.
java.io.IOException: No FileSystem for scheme: https
请考虑我得到的错误是针对给定的 URL。
【问题讨论】:
标签: scala apache-spark pyspark apache-spark-sql