【发布时间】:2021-01-07 02:05:03
【问题描述】:
我正在尝试抓取以下 HTML:
<select id="sizeShoe" name="attributes['size']" class="selectFld col-xs-12">
<option value="">Select Size</option>
<option value="025">2.5</option>
<option value="035">3.5</option>
<option value="040">4</option>
<option value="045">4.5</option>
<option value="050">5</option>
<option value="055">5.5</option>
<option value="060">6</option>
<option value="065">6.5</option>
<option value="070">7</option>
<option value="075">7.5</option>
<option value="080">8</option>
<option value="085" selected="selected">8.5</option>
<option value="090">9</option>
</select>
我需要创建一个具有以下值的字典:
argument = {"2.5":"025", "3.5":"035, "4":"040" ecc...}
我的尝试:
soup = BeautifulSoup(response.text, "lxml")
soup.prettify()
argument = {}
sizeShoe = soup.find("select", attrs={'id' : 'sizeShoe'})
for a in sizeShoe:
valor = sizeShoe.get("value")
但是valor的结果是None。
如何抓取数据并将其保存为字典? 还有比 BeautifulSoup 更快的库吗?
【问题讨论】:
标签: python html beautifulsoup screen-scraping