【问题标题】:Extract a list of HTML attribute values using beautifulsoup使用 beautifulsoup 提取 HTML 属性值列表
【发布时间】:2016-02-16 15:06:30
【问题描述】:

给定一个包含元素列表的页面,例如<input> 元素,它们都有一个共同的类,例如category-checkbox,如何使用 beautifulsoup 将所有这些元素的值提取到列表中?例如:

<input type="checkbox" class="category-checkbox" value="apples" />
<input type="checkbox" class="category-checkbox" value="pears" />
<input type="checkbox" class="category-checkbox" value="oranges" />

【问题讨论】:

    标签: python html list python-3.x beautifulsoup


    【解决方案1】:

    我最终将元素映射到一个新列表:

    # assume the html variable is a beautifulsoup object
    input_values = [
        element.get('value') for element in
        html.findAll('input', {"class": "category-checkbox"})
    ]
    # category_input_values is now [ 'apples', 'pears', 'oranges' ]
    

    【讨论】:

    • 您是否在发布问题 2 秒后回答了自己的问题?
    • @RafaelCardoso 是的 :) 你知道“回答你自己的问题,问答风格”按钮,你可以点击 SO 问题?这就是我所做的,以防它帮助别人。当我在研究如何做到这一点时,我没有找到我正在寻找的确切答案。另外,如果有人能想出更好的方法,我会很高兴看到。
    猜你喜欢
    • 2011-02-06
    • 2010-12-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多