【发布时间】:2021-02-01 06:59:38
【问题描述】:
我正在学习beautifulsoup,但遇到了一个问题。那就是在html中抓取dd标签。查看下图,我想获取红色区域中的参数。问题是我不知道如何访问它们。我试过这个:
kvadratura = float(nek_html.find('span', class_='d-inline-block mt-auto').text.split(' ')[0])
jedinica_mere = nek_html.find('span', class_='d-inline-block mt-auto').text.split(' ')[1].strip()
...
但问题是有时不同的页面有不同的参数,或者参数的顺序不同,所以我无法使用 index.html 访问。查看链接:
https://www.nekretnine.rs/stambeni-objekti/stanovi/centar-zmaj-jovina-salonac-id1003/NkmUEzjEFo0/
我如何确定我总是会抓取我想要的参数?
每个参数之后都会进入列表,因此如果某些参数现在确实存在,则应将 '' 添加到列表中
【问题讨论】:
标签: python web-scraping beautifulsoup