【发布时间】:2026-01-31 00:10:01
【问题描述】:
我正在使用Python 进行网络抓取并使用BeutifulSoup 库
我有这样的HTML 标记:
<tr class="deals" data-url="www.example2.com">
<span class="hotel-name">
<a href="www.example2.com"></a>
</span>
</tr>
<tr class="deals" data-url="www.example3.com">
<span class="hotel-name">
<a href="www.example3.com"></a>
</span>
</tr>
我想在所有<tr>s 中获取data-url 或href 值。如果我能得到href 的价值就更好了
这是我的相关代码的小sn-p:
main_url = "http://localhost/test.htm"
page = requests.get(main_url).text
soup_expatistan = BeautifulSoup(page)
print (soup_expatistan.select("tr.deals").data-url)
# or print (soup_expatistan.select("tr.deals").["data-url"])
【问题讨论】:
标签: python css python-3.x beautifulsoup html-parsing