【发布时间】:2013-10-23 22:32:43
【问题描述】:
我知道如何找到所有链接,但我想要链接后的文本。
例如,在给定的 html 中:
<p><a href="/cgi-bin/bdquery/?&Db=d106&querybd=@FIELD(FLD004+@4((@1(Rep+Armey++Richard+K.))+00028))">Rep Armey, Richard K.</a> [TX-26]
- 11/9/1999
<br/><a href="/cgi-bin/bdquery/?&Db=d106&querybd=@FIELD(FLD004+@4((@1(Rep+Davis++Thomas+M.))+00274))">Rep Davis, Thomas M.</a> [VA-11]
- 11/9/1999
<br/><a href="/cgi-bin/bdquery/?&Db=d106&querybd=@FIELD(FLD004+@4((@1(Rep+DeLay++Tom))+00282))">Rep DeLay, Tom</a> [TX-22]
- 11/9/1999
...(重复多次)
我想提取与<a href=... >Rep Dreier, David</a>关联的[CA-28] - 11/9/1999
并对列表中的所有链接执行此操作
【问题讨论】:
-
findNextSibling?无法在我的站点上安装 BeautifulSoup 进行测试。
标签: python beautifulsoup