【问题标题】:BeautifulSoup parsing nested div tagsBeautifulSoup 解析嵌套的 div 标签
【发布时间】:2013-12-20 11:29:35
【问题描述】:

我需要从以下结构中选择第二个 div

<div>
A
  **<div>**
    B
      <div>
        C
      </div>
  </div>
</div>

<div>
A
  **<div>**
    B
      <div>
        C
      </div>
  </div>
</div>

我使用 select 来做到这一点:

divs = soup.select("div > div")

但随着第二个 div 及其内容,它也单独选择第三个 div 作为列表的一部分。如何在我的返回列表中只选择标记为 的 div。

【问题讨论】:

    标签: beautifulsoup


    【解决方案1】:

    在 Python 中,您可以使用以下行:

    # select all the div tags in page
    divs = soup.find_all('div')
    
    for item in divs:      
      inner_div = item.div
    

    首先选择所有 div 标签,然后单独选择每个标签。如果您想翻译成另一种语言,请访问该语言的 Beautiful Soup 页面。

    【讨论】:

      最近更新 更多