【发布时间】:2019-06-29 00:31:00
【问题描述】:
我正在尝试通过 python 脚本访问 Azure databricks spark 集群,该脚本将令牌作为通过 databricks 用户设置生成的输入,并调用 Get 方法来获取集群的详细信息以及集群 ID。
下面是代码sn-p。如图所示,我在中南区创建了一个集群。
import requests
headers = {"Authorization":"Bearer dapiad************************"}
data=requests.get("https://southcentralus.azuredatabricks.net/api/2.0/clusters/get?cluster_id=**************",headers=headers).text
print data
预期结果应该给出集群的完整细节,例如。
{"cluster_id":"0128-******","spark_context_id":3850138716505089853,"cluster_name":"abcdxyz","spark_version":"5.1.x-scala2.11","spark_conf":{"spark.databricks.delta.preview.enabled":"true"},"node_type_id" and so on .....}
当我在 google colaboratory 上执行代码时,上面的代码正在运行,而在我的本地 IDE (即空闲)上同样无法运行。它给出了 HTTP 403 的错误,如下所示:
<p>Problem accessing /api/2.0/clusters/get. Reason:
<pre> Invalid access token.</pre></p>
谁能帮我解决这个问题?我卡在这部分,无法通过 API 访问集群。
【问题讨论】:
-
这可能是由于您传递秘密时的编码问题。请调查这个问题以及如何解决它。 forums.databricks.com/questions/6590/… & forums.databricks.com/questions/6621/…
标签: python apache-spark access-token http-error azure-databricks