【发布时间】:2016-11-07 18:33:21
【问题描述】:
如何仅获取其他标签旁边的特定标签。所以如果我这样做了
soup.findAll('blockquote') 我将获得所有块引用的列表,但我只想要块引用,它也位于名称为 attr 的标记旁边。 <a name="*">
所以我的块引用列表不会包含这样的内容:
<blockquote>
<i>Intro </i>
</blockquote>
当我想要的时候
<blockquote><a name="*"> </blockquote>
下面是示例,但还有一些其他的块引用,带有其他内部标记。但我只想要带有<a name="*"> 内部标签的那些。
<blockquote>
<i>Intro </i>
</blockquote>, <blockquote>
<a name="1">a </a><br>
</br></blockquote>, <blockquote>
<a name="2">x </a><br>
<a name="3">y </a><br>
<a name="4">z </a><br>
</br></br></br></blockquote>
好吧,或者我想要得到这样的结果
<blockquote>
<a name="1">a </a><br>
</br></blockquote>, <blockquote>
<a name="2">x </a><br>
<a name="3">y </a><br>
<a name="4">z </a><br>
</br></br></br></blockquote>
【问题讨论】:
标签: python web-scraping beautifulsoup