【发布时间】:2021-03-25 17:28:21
【问题描述】:
我正在尝试使用 BeautifulSoup 和 Python 中的请求从该网站 https://bitinfocharts.com/comparison/bitcoin-transactions.html 获取所有数据点。到目前为止,我有代码:
session = requests.Session()
page = session.get(https://bitinfocharts.com/comparison/bitcoin-transactions.html)
soup = BeautifulSoup(page.content, 'html.parser')
values = soup.find_all('script')[4]
这将返回所有数据点所在的 html 代码部分,但数据点是 Dygraph 的一部分,我不知道如何获取它们。我也试过了
values = soup.find_all('script')[4].get_text()
但这根本不会返回任何东西。
d = new Dygraph(document.getElementById("container"),[[new Date("2009/01/03"),null],[new Date("2009/01/04"),null],
[new Date("2009/01/05"),null],[new Date("2009/01/06"),null],[new Date("2009/01/07"),null],
[new Date("2009/01/08"),null],[new Date("2009/01/09"),null],[new Date("2009/01/10"),null],
[new Date("2009/01/11"),null],[new Date("2009/01/12"),7]........etc
在网站代码上,数据看起来像这样,但我不熟悉这意味着什么以及如何获取这些数据。我不知道数据集开头和结尾的双括号代表什么。
【问题讨论】:
标签: python html beautifulsoup python-requests dygraphs