【发布时间】:2015-11-02 19:53:05
【问题描述】:
我正在尝试在这里解析一些 html 并使用漂亮的汤
有时我会搜索特定的 div 标签,如下所示:
print soup.find("div", {"class": "sorteringsvalg Alle"})
返回的输出如下:
<div class="sorteringsvalg Alle"> Alle <label class="sorteringtype">
<input checked="" name="type" type="radio" value="Alle"/>(638) </label></div>
我感兴趣的是括号中的数字,所以我需要进一步处理这些数据。我尝试过对此使用 're' 正则表达式,但返回的对象没有表示为字符串,因此它不起作用。
【问题讨论】:
标签: python html python-2.7 html-parsing bs4