【发布时间】:2021-11-03 10:24:20
【问题描述】:
我正在尝试从 href 中提取 url,但他们会给我一个空列表
import requests
from bs4 import BeautifulSoup
headers ={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36'
}
r =requests.get('https://www.redfin.com/city/5357/WA/Edmonds')
soup=BeautifulSoup(r.content, 'html.parser')
tra=soup.find_all('div',class_='bottomV2')
for links in tra:
for link in links.find_all('a',href=True):
comp=link['href']
print(comp)
【问题讨论】:
-
看看你的汤——“糟糕!看起来我们的使用分析算法认为你可能是一个机器人。以自动方式访问 redfin.com 违反了 Redfin 的使用条款。"
-
现在我能做些什么来解决这些问题请指导我们
-
您可以进入页面(以人类身份),将其保存为 HTML 文件,然后从文件中将其读入
soup。
标签: python web-scraping beautifulsoup