【问题标题】:how to get a nested element? [closed]如何获取嵌套元素? [关闭]
【发布时间】:2014-02-23 17:19:42
【问题描述】:

html:

<a title="ЧП в СаранскеСсылка на это сообщение #41" rel="bookmark" href="http://forum.saransk.ru/topic/193296-chp-v-saranske/page-3#entry3556494" data-entry-pid="3556494" itemprop="replyToUrl">               
    #41
    <img title="ЧП в СаранскеСсылка на это сообщение #41" class="small" src="http://forum.saransk.ru//public/style_images/master/icon_share.png">
</a>


<a title="ЧП в СаранскеСсылка на это сообщение #41" rel="bookmark" href="http://forum.saransk.ru/topic/193296-chp-v-saranske/page-3#entry3556494" data-entry-pid="3556494" itemprop="replyToUrl">               
    #42
    <img title="ЧП в СаранскеСсылка на это сообщение #41" class="small" src="http://forum.saransk.ru//public/style_images/master/icon_share.png">
</a>

..................

请帮忙制作一个序列号列表。它应该看起来像这样:

['#41', '#42', '#43', '#44', '#45', '#46']

我使用以下代码:

list = []
html = requests.get(value)
soup = bs4.BeautifulSoup(html.text)
num = soup.findAll('a', {'itemprop': 'replyToUrl'})
print(value , num, end='\n')
list.append(num)

但这段代码放在额外数据列表中

【问题讨论】:

    标签: python python-3.x beautifulsoup


    【解决方案1】:
    >>> [a.text.strip() for a in soup.find_all('a', {'itemprop': 'replyToUrl'})]
    [u'#41', u'#42', u'#43', u'#44', u'#45', u'#46', u'#47', u'#48', u'#49', u'#50']
    

    【讨论】:

      猜你喜欢
      • 2021-06-04
      • 2018-04-06
      • 2022-07-15
      • 2014-01-23
      • 1970-01-01
      • 2021-09-04
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多