【发布时间】:2020-09-11 09:21:10
【问题描述】:
我正在尝试下载某个 github 存储库中托管的 json 文件。这是link。
问题是,当我尝试使用 python 解码 json 时,出现以下错误:
JSONDecodeError: Expecting value: line 1 column 1 (char 0)
这听起来像是不正确的 json 格式,所以当我在编辑器中手动打开文件时,我看到的是这样的:
这不是一个 json 文件,但这是应该的。相反,我得到了这个树形结构的文件。我需要使用pandas 将其加载到dataframe 中。有人可以在这里指出我正确的方向吗?我做错了什么?
这是我用来获取该文件的代码:
import urllib.request as r
from bs4 import BeautifulSoup as bs
import json
url = r.urlopen("https://raw.githubusercontent.com/aavail/ai-workflow-capstone/master/cs-train/invoices-2017-11.json")
content = url.read()
soup = bs(content)
newDictionary=json.loads(str(soup))
非常感谢您
【问题讨论】:
-
恭喜! 1000 代表。
-
谢谢@AnnZen! :D
标签: python json python-3.x pandas beautifulsoup