【问题标题】:How can i grab the hyperlinks in web page using python [closed]我如何使用python获取网页中的超链接[关闭]
【发布时间】:2023-11-25 21:13:01
【问题描述】:

我有一个网页,其中的结构类似于

<div>
<ul>
<li class=tree>
<a>  </a>
</li>
</ul>
</div>

现在我想获取所有这些超链接并在 python 中放入文本文件

【问题讨论】:

  • 您是否尝试过其中一个相关链接?
  • 此链接可能会有所帮助*.com/questions/1080411/…
  • 这已被多次询问和回答。去查找 Beautiful Soup 并阅读文档。
  • @Ignacio 我不想使用漂亮的汤。有人说漂亮的肥皂目前还没有开发出来。有没有其他选择
  • @bidu 有任何可靠消息来源说BeautifulSoup 目前尚未开发(更新:他们的launchpad site 对我来说似乎不是无效的)?

标签: python html-parsing urllib2 lxml


【解决方案1】:

【讨论】:

    【解决方案2】:

    您可以使用模块xml.dom.minidom,但如果这是一个问题,它不会移植到某些版本的python3。

    【讨论】:

      最近更新 更多