【发布时间】:2020-09-13 17:08:23
【问题描述】:
我正在尝试使用 BeautifulSoup 和 Selenium 从网站中提取数据,因为该网站有很多动态内容。尽管我使用 Selenium 来模拟 webdriver,但它返回的结果数量与仅使用 BeautifulSoup 相同。 len(container) 应该等于 20,但是它始终返回 4。我不确定我做错了什么,或者如何解决这个问题。以下是我的代码:
import bs4
import requests
from bs4 import BeautifulSoup as soup
from selenium import webdriver
url = 'https://www.immowelt.at/liste/wien/wohnungen/mieten?eqid=1011&cp=1'
options = webdriver.ChromeOptions()
options.add_experimental_option("excludeSwitches", ["enable-logging"])
options.add_argument('--headless')
options.add_argument('--blink-settings=imagesEnabled=false')
driver = webdriver.Chrome(options=options, executable_path=r'C:\Users\xxx\chromedriver')
driver.get(url)
html = driver.page_source
page_soup = soup(html, 'html.parser')
container = page_soup.findAll('div', class_='listcontent clear')
print(len(container))
【问题讨论】:
标签: python-3.x selenium-webdriver beautifulsoup selenium-chromedriver