【问题标题】:using BeautifulSoup to find the href link使用 BeautifulSoup 查找 href 链接
【发布时间】:2019-08-28 11:36:19
【问题描述】:

我正在使用 BeautifulSoup 按“reply_to”类查找 href。

<div class="message">
   <div class="reply_to details">
        In reply to <a href="#go_to_message18" onclick="return 
        GoToMessage(18)">this message</a>
   </div>
</div>

现在下面的代码可以找到reply_to元素,但是接下来如何去查找和检索href

soup = BeautifulSoup(parsed.input[0], "html.parser")
alldefaultmesssages = soup.select(".message.default")
alldefaultmesssages.select_one(".reply_to")

【问题讨论】:

标签: python html href


【解决方案1】:

你需要得到reply_to元素的子anchor标签:

import requests
from bs4 import BeautifulSoup


html = """<div class="message">
   <div class="reply_to details">
        In reply to <a href="#go_to_message18" onclick="return
        GoToMessage(18)">this message</a>
   </div>
</div>"""

soup = BeautifulSoup(html, 'html.parser')
print(soup.find("div", class_="reply_to").a.get('href'))
#>>> #go_to_message18

【讨论】:

    猜你喜欢
    • 2019-02-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-12-20
    • 1970-01-01
    • 2017-03-17
    • 2015-12-05
    • 1970-01-01
    相关资源
    最近更新 更多