【发布时间】:2018-10-16 12:35:07
【问题描述】:
给了我一个 HTML 代码,我特别感兴趣的部分如下所示:
<a href="/go/wydarzenia/rozrywka/35826-majowka-w-twierdzy-klodzko?
termin=265036" class="link with-img"> <img
src="/go/resources/main/img//download/img-
14ab4e372df7bd0826c90f429f0e5933/twierdza-przewodnik-jpg.jpg" alt="Majówka w
Twierdzy Kłodzko" class=""/>
我知道它看起来有点乱,但无论如何我必须处理它。
我的工作是提取 alt 之后的文本。
所以在上面的代码中,输出应该是这样的
>> Majówka w Twierdzy Kłodzko
我阅读了here 很多关于通过搜索 CSS 类或 HTML 标记来提取数据的有用信息。但是我没有发现任何关于 alt 的内容。 我将不胜感激。
这是我经过一些更改后的代码
import requests
from bs4 import BeautifulSoup
url = 'https://www.wroclaw.pl/go/wydarzenia/rozrywka/eventy'
soup = BeautifulSoup(requests.get(url).content, "html.parser")
print(soup.a.img.attrs["alt"])
输出显示:
AttributeError: 'NoneType' 对象没有属性 'attrs'
我做错了什么?
【问题讨论】:
标签: python web beautifulsoup