【问题标题】:How to get contents of nested tag using BeautifulSoup如何使用 BeautifulSoup 获取嵌套标签的内容
【发布时间】:2014-01-07 21:35:40
【问题描述】:

如何使用 BeautifullSoup 获取结束 span 标签之前的数字?

<span class="count">
<i class="icon-user"></i>
30.5K </span>

我可以使用:

usercount=soup.findAll('span',{'class':'count'})

但不是:

usercount=soup.findAll('i',{'class':'count'})

【问题讨论】:

    标签: beautifulsoup


    【解决方案1】:

    您要查找的文本是&lt;span&gt;&lt;i&gt; 之后的文本节点:

    import bs4
    
    soup = bs4.BeautifulSoup('''
        <span class="count">
        <i class="icon-user"></i>
        30.5K </span>
    ''')
    
    usercount = soup.find('span', class_='count').find('i').next.strip()
    

    【讨论】: