【发布时间】:2011-08-14 12:25:18
【问题描述】:
我有以下soup:
<a href="some_url">next</a>
<span class="class">...</span>
我想从中提取href,"some_url"
如果我只有一个标签,我可以做到,但这里有两个标签。我也可以得到文字'next',但这不是我想要的。
另外,在某处是否有关于 API 的良好描述以及示例。我正在使用the standard documentation,但我正在寻找更有条理的东西。
【问题讨论】:
-
请发布代码示例以展示您的尝试
-
好吧,我想通了:soup.find('a')['href'] 让我感到困惑的是我使用 django (html) 来查看它,它实际上删除了href 呈现之前:soup.find('a') 仅变为 'next'
-
没错,这个问题是重复的。然而,即使在几年后,@MarkLongair 的回答的美妙之处也让它变得珍贵。
标签: python tags beautifulsoup