【发布时间】:2019-12-28 16:11:14
【问题描述】:
我试图进入此网址的“原始”链接。 它是 url + 'AHS_'(第一项)
url = http://pen.jamstec.go.jp/
html = requests.get(url).text
soup = BeautifulSoup(html, 'html5lib')
print (soup)
for item in soup.find_all('a'):
result = item['href']
print (result)
但是,它提供了过多的信息。
我怎样才能得到“AHS_/”作为结果
【问题讨论】:
-
我不太明白。您想从 ID 为“AHS”的“原始”链接获取 URL 吗?
-
对,也可以
-
在询问依赖数据的代码时,重要的是要在您的问题中包含数据的最小示例,特别是如果该数据来自外部资源。您越容易让 我们 从您的问题中复制和粘贴(以便我们可以执行您的代码并测试我们的解决方案),您就越有可能获得回复。 - minimal reproducible example
标签: python html beautifulsoup