【发布时间】:2019-07-29 18:47:43
【问题描述】:
我试图从 konga.com 抓取数据。但我能够刮掉第一页,但第二页出现问题。我还复制了网站第 2 页的 URL,但它确实有效。 代码如下:
from selenium import webdriver
import time
browser = webdriver.Chrome(executable_path='C:\Python27\Scripts\chromedriver.exe')
for i in range(1,50):
y= '%0d'%i
url="https://www.konga.com/category/electronics-5261?"+ "page="+'%0d'%i
print url
browser.get("url")
p=browser.find_elements_by_xpath ("//div[@class='af885_1iPzH']/h3")
for a in p:
print '.........page'+ str(i)+ '..........'
print a.text
【问题讨论】:
-
你想彻底废弃什么?
-
from selenium import webdriver import time browser = webdriver.Chrome(executable_path='C:\Python27\Scripts\chromedriver.exe') for i in range(1,50): y= '%0d '%i url="konga.com/category/electronics-5261?"+"page="+'%0d'%i 打印url browser.get("url") p=browser.find_elements_by_xpath("//div[@class='af885_1iPzH']/h3 ") #q=browser.find_elements_by_xpath ("//div[@class='_4e81a_39Ehs']/span[@class='d7c0f_sJAqi']") for i in p: print '.......page '+ str(i)+ '........' 打印 i.text
-
我指的是您页面上的元素。我得到了脚本,但我不确定你在页面上寻找什么。
-
我正在尝试获取所列产品的名称
-
欢迎来到 SO。请花时间阅读 stackoverflow.com/help/how-to-ask。它将帮助您提出可靠的问题,这些问题有望得到有用的答案。并且——根据@Edeki Okoh 的指示——不要在 cmets 中发布代码(而是编辑原始问题)。
标签: python selenium web-scraping pagination