【发布时间】:2020-11-09 16:35:29
【问题描述】:
我正在尝试阅读以下内容:
我的目标是阅读此页面上的每个职位 - https://www.cvbankas.lt/?miestas=Vilnius&padalinys%5B%5D=&keyw=python
我尝试过的:
import requests
from bs4 import BeautifulSoup
URL = 'https://www.cvbankas.lt/?miestas=Vilnius&padalinys%5B%5D=&keyw=python'
page = requests.get(URL).text
soup = BeautifulSoup(page, 'html.parser')
results = soup.find(id='ResultsContainer')
# Look for Python jobs
python_jobs = results.find_all("div", string=lambda t: "python" in t.lower())
for p_job in python_jobs:
link = p_job.find("h3")["href"]
print(p_job.text.strip())
print(f"Apply here: {link}\n")
但我收到以下错误:
AttributeError: 'NoneType' 对象没有属性 'find_all'
如何阅读所有标题?
【问题讨论】:
-
你确定那里有一个id为'ResultsContainer'的元素吗?
-
当我在您指定的 URL 上打开 devtools 时,我什至找不到 ID
ResultsContainer- 这是在您的代码中 -
应该是'main_container' id。
-
我也不确定
div标签名称是results.find_all("div", string=lambda t: "python" in t.lower())的正确选择。一个正确的选择可能是article。
标签: python beautifulsoup