【问题标题】:Scraping addresses using Selenium and Python使用 Selenium 和 Python 抓取地址
【发布时间】:2018-03-28 20:10:38
【问题描述】:

首先,我不得不说我是从 Python 开始的。我想从使用脚本构建的网页中获取地址。我尝试使用 Python 3.x 和 Selenium。简单的代码会生成一个完整的商店列表,但我想将其拆分以构建一个包含命名列(名称、街道、邮政编码等)的表。我希望有一个聪明的解决方案。

from selenium import webdriver 
browser = webdriver.Chrome(executable_path="E:/Dysk Google/Dokumenty/chromedriver")
browser.get("http://hilding.pl/materace-mazowieckie.html")        
shops=browser.find_element_by_id('div_province')
print(shops)
browser.close()

【问题讨论】:

  • 获取姓名、街道等信息的代码在哪里?

标签: python-3.x selenium-webdriver web-scraping


【解决方案1】:

试试下面的脚本。以下是获取namestreetzipcode 等的方法。

from selenium import webdriver 

Browser = webdriver.Chrome() ##If necessary, include the path
Browser.get("http://hilding.pl/materace-mazowieckie.html")

for items in Browser.find_elements_by_css_selector("#div_province .shop"):
    name = items.find_element_by_css_selector(".name").text
    street = items.find_element_by_css_selector(".streat").text
    zip_code = items.find_element_by_css_selector(".zipcode").text
    print(name,street,zip_code)

Browser.quit()

部分输出:

SALON NAP ul. Jagielska 73 02-886
SALON NAP/ DOMOTEKA ul. Malborska 41 03-286
SALON NAP ul. Mysia 3 00 - 496
SKLEP ECCELENT DOMOTEKA ul. Malborska 41 03-286
SKLEP ECCELENT, C.H. MEGA MEBLE al. Jerozolimskie 200 02-486
SKLEP ECCELENT, CH JUPITER ul. Towarowa 22 00-839

【讨论】:

  • 谢谢!这就是我想要得到的!如何将其导出到带有命名列的 excel 文件?
猜你喜欢
  • 2021-11-05
  • 1970-01-01
  • 2020-01-10
  • 2022-10-05
  • 2020-10-29
  • 2014-02-22
  • 1970-01-01
  • 2013-01-09
  • 2021-03-08
相关资源
最近更新 更多