【发布时间】:2021-01-12 19:20:13
【问题描述】:
我需要的是每条记录的“标题”和“GetCapabilitiesUrl”。我尝试过使用 BeautifulSoup,但找不到获取所需数据的正确方法。
有人知道如何处理吗?
谢谢。
【问题讨论】:
-
欢迎来到 SO - 请使用 tour 并阅读 How to Ask 以改进、编辑和格式化您的问题。谢谢(显示您编写的代码会很棒)
-
也许我遗漏了一些东西,但您的 URL 似乎提供的是 JSON,而不是 XML。
-
BS4 对此太过分了。它看起来已经像 JSON - 可能会摆脱
requests和标准库json模块 -
是的。你说的对。得到了我想要的:` import requests import json url = "kartkatalog.geonorge.no/api/…" json_data = requests.get(url).json() antall = json_data["NumFound"] for i in range(antall): tittel = json_data [“结果”][i][“标题”]打印(标题)`
标签: python xml web-scraping