【发布时间】:2022-01-20 22:08:27
【问题描述】:
我是 Python 和学习数据分析的新手。我正在尝试从这个网页上抓取数据:https://bitinfocharts.com/dogecoin/address/DN5Hp2kCkvCsdwr5SPmwHpiJgjKnC5wcT7
我可以使用简单的网站抓取数据,但我认为由于 BitInfoCharts 有表格,因此它可能是一个比我所关注的教程更复杂的 HTML 设置。
我的目标是从表格中抓取数据,包括区块、时间、金额、余额等,并将其保存在 csv 文件中。我之前尝试过使用 pandas,但发现很难从 HTML 中选择我想要的数据。
为此,我认为我需要做的是从“class="table abtb tablesorter tablesorter-default" 中获取表头/表信息,然后从包含该类的每个对象中提取所有信息"class="trb"。 class=trb 因页面而异(例如,一个人可能有 7 笔交易,而另一个人可能有 40 笔)。不过我不太确定,因为这对我来说是新领域。
非常感谢任何帮助。
import requests
from bs4 import BeautifulSoup as bs
url = 'https://bitinfocharts.com/dogecoin/address/DN5Hp2kCkvCsdwr5SPmwHpiJgjKnC5wcT7'
headers = {"User-Agent":"Mozilla/5.0"}
r = requests.get(url, headers=headers)
soup = bs(r.content)
table = soup.find_all("table_maina")
print(table)
【问题讨论】:
标签: python web-scraping beautifulsoup