【发布时间】:2020-09-02 08:16:17
【问题描述】:
我对 Python 完全陌生,真的需要一些帮助。
我正在尝试解析网页并从网页中检索电子邮件地址。 我尝试了很多我在网上阅读的东西,但都失败了。
我意识到,在运行 BeautifulSoup(browser.page_source) 时,它会带来源代码,但由于某种原因,它并没有带来电子邮件地址或业务资料。
下面是我的代码(不要评判:-))
import os, random, sys, time
from urllib.parse import urlparse
from selenium import webdriver
from bs4 import BeautifulSoup
from webdriver_manager.chrome import ChromeDriverManager
import lxml
browser = webdriver.Chrome('./chromedriver.exe')
url = ('https://www.yellowpages.co.za/search?what=accountant&where=cape+town&pg=1')
browser.get(url)
BeautifulSoup(browser.page_source)
旁注:我的目标是根据搜索条件浏览网页并解析每个页面的电子邮件地址,我已经弄清楚如何浏览网页并发送密钥,这只是我坚持的解析。 非常感谢您的帮助
【问题讨论】:
标签: python html parsing web-scraping beautifulsoup