【发布时间】:2025-11-28 22:55:02
【问题描述】:
我目前正在 Coursera 上学习 Python 专业。我遇到了使用 BeautifulSoup 从网页中提取特定链接的问题。从这个网页 (http://py4e-data.dr-chuck.net/known_by_Fikret.html),我应该从用户输入中提取一个 URL 并打开后续链接,所有这些链接都通过锚选项卡标识并运行一些迭代。
虽然我可以使用列表对它们进行编程,但我想知道是否有更简单的方法可以在不使用列表或字典的情况下进行编程?
html = urllib.request.urlopen(url, context=ctx).read()
soup = BeautifulSoup(html, 'html.parser')
tags = soup('a')
nameList=list()
loc=''
count=0
for tag in tags:
loc=tag.get('href',None)
nameList.append(loc)
url=nameList[pos-1]
在上面的代码中,你会注意到在使用'a'标签和'href'定位链接之后,我不得不创建一个名为nameList的列表来定位链接的位置。由于这效率低下,我想知道是否可以在不使用列表的情况下直接定位 URL。提前致谢!
【问题讨论】:
标签: python html beautifulsoup